写点什么

京东零售大模型推理优化实践|AICon 北京

  • 2025-06-11
    北京
  • 本文字数:927 字

    阅读完需:约 3 分钟

大小:523.27K时长:02:58
京东零售大模型推理优化实践|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


京东零售 AI 架构师杨培军已确认出席并发表题为《京东零售大模型推理优化实践》的主题分享。随着 DeepSeek 的爆火,其卓越的性能和成本引起了科技界的广泛关注,同时经过一两年的技术发展,LLM 推理加速与部署进入深水区。LLM 模型在京东零售内部有大量面向 C 端用户、B 端商家和广告主系统等的落地应用,业务场景提出了较高的 SLO 要求和成本压力,如何兼顾高吞吐与低时延是迫切要解决的问题。本次演讲将展开介绍这其中面临的技术挑战和核心技术要点,分享可落地的优化实践经验。



杨培军目前担任京东零售 AI 域架构师,长期从事深度学习和搜推广架构相关方向,擅长深度学习平台、CTR 稀疏和 LLM/LVM 稠密推理加速等领域,曾就职于阿里妈妈和 Bigo 负责机器学习相关平台的建设。他在本次会议的详细演讲内容如下:


演讲提纲

1. 京东零售大模型应用场景

2. 大模型推理服务落地面临的技术挑战

3. 推理服务核心优化技术

  • 技术架构与核心功能

  • 请求/实例全局调度

  • 全异步化运行与多层流水线

  • 算子高效执行与显存管理

4. 未来优化方向展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 要求开发者对 CPU/GPU/NPU 高性能编程,以及 LLM/LVM 模型有深刻理解和技术掌握。


您的演讲有哪些前沿亮点?

  • LLM 推理仍面临较大的成本压力,结合用户体验 SLO 要求,如何兼顾高吞吐与低时延目前前沿且迫切要解决的技术难点。


听众收益

  • 了解 LLM 推理在工业界落地的前沿进展、业务落地技术挑战,以及技术解决方案。


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-11 13:001

评论

发布
暂无评论

全能代码编辑器:CodeRunner 最新激活版

真大的脸盆

Mac 代码编辑器 Mac 软件 代码编辑 编辑代码

深入理解spring mvc启动过程与原理

三十而立

Java spring 程序员 开发 IT

pytest学习和使用2-初步使用和用例运行

Python 自动化测试 pytest

有效载荷标识与内容类型--MQTT 5.0新特性

EMQ映云科技

物联网 IoT mqtt 企业号 3 月 PK 榜 有效载荷标识

共享订阅--MQTT 5.0新特性

EMQ映云科技

物联网 IoT mqtt 企业号 3 月 PK 榜 共享订阅

温湿度计设备通过阿里云IoT物联网套件上报数据到钉钉群机器人实践——数据价值类

阿里云AIoT

JavaScript Serverless 物联网 机器人 机器学习/深度学习

设计消息队列存储消息数据的 MySQL 表格

Geek_7d539e

Java 8 的异步利器:CompletableFuture源码解析(建议精读)

Java你猿哥

Java ssm java8 源码解析

手把手教你写spring boot starter

三十而立

Java 程序员 IT springboot boot

国家高新技术企业是国企吗?获得高新企业证书有什么用?

行云管家

高新企业 高新技术

PS 2023版本 24.2有哪些新功能?增加了哪些相机配置?

Rose

ps ps 2023 Photoshop 2023下载

大资管行业数字化转型解决方案 | 行业方案

袋鼠云数栈

大数据 数字化转型 解决方案

TiDB SQL调优案例之避免TiFlash帮倒忙

TiDB 社区干货传送门

性能调优 实践案例 故障排查/诊断

BSN-DDC基础网络详解(五):接入DDC网络(2)

BSN研习社

BSN-DDC基础网络

【分布式技术专题】「分布式技术架构」一文带你厘清分布式事务协议及分布式一致性协议的算法原理和核心流程机制(Paxos篇)

码界西柚

分布式 PAXOS paxos协议 算法分析

NFTScan 与 UniPass 达成合作伙伴,双方在多链 NFT 数据方面展开合作!

NFT Research

NFT

阿里120W年薪架构师力荐750页微服务架构深度解析笔记

程序知音

Java 微服务 编程语言 后端技术

Apache APISIX 3.2.0 LTS 正式发布

API7.ai 技术团队

1个案例读懂——游戏产品如何用A/B测试做增长

字节跳动数据平台

云服务 AB testing实战 A/B测试 企业号 3 月 PK 榜

武汉等保测评有限公司有哪几家?具体位于哪里?

行云管家

等保 等保测评 等保2.0 武汉

技术详解 阿里云AIoT物模型支撑设备规模已超亿级——设备管理运维类

阿里云AIoT

运维 安全 监控 物联网 芯片

实战|网站监控如何做好监测点管理与内网数据采集

云智慧AIOps社区

安全 监控 监控宝 云智慧 网站监控

Macbook技巧,Type-c接口失灵怎么办

互联网搬砖工作者

阿里云AIoT物联网平台如何实现设备全球就近接入——设备接入类

阿里云AIoT

运维 监控 物联网 中间件 数据采集

浅谈DWS函数出参方式

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

面试没有分库分表经验,就看这篇

三十而立

Java sql 程序员 IT 分库

快速尝鲜:RabbitMQ 搭建完就得用起来

Java你猿哥

Java Spring Boot ssm RabbitMQ

基于 Apache Flink 的实时计算数据流业务引擎在京东零售的实践和落地

Apache Flink

大数据 flink 实时计算

GuavaCache与物模型大对象引起的内存暴涨分析——设备管理运维类

阿里云AIoT

缓存 算法 监控 物联网 数据格式

pytest学习和使用1-pytest安装和版本查看

Python 自动化测试 pytest

物联网数据应用开发最佳实践——数据价值类

阿里云AIoT

数据挖掘 物联网 存储 数据管理 调度

京东零售大模型推理优化实践|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章