写点什么

京东零售大模型推理优化实践|AICon 北京

  • 2025-06-11
    北京
  • 本文字数:927 字

    阅读完需:约 3 分钟

大小:523.27K时长:02:58
京东零售大模型推理优化实践|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


京东零售 AI 架构师杨培军已确认出席并发表题为《京东零售大模型推理优化实践》的主题分享。随着 DeepSeek 的爆火,其卓越的性能和成本引起了科技界的广泛关注,同时经过一两年的技术发展,LLM 推理加速与部署进入深水区。LLM 模型在京东零售内部有大量面向 C 端用户、B 端商家和广告主系统等的落地应用,业务场景提出了较高的 SLO 要求和成本压力,如何兼顾高吞吐与低时延是迫切要解决的问题。本次演讲将展开介绍这其中面临的技术挑战和核心技术要点,分享可落地的优化实践经验。



杨培军目前担任京东零售 AI 域架构师,长期从事深度学习和搜推广架构相关方向,擅长深度学习平台、CTR 稀疏和 LLM/LVM 稠密推理加速等领域,曾就职于阿里妈妈和 Bigo 负责机器学习相关平台的建设。他在本次会议的详细演讲内容如下:


演讲提纲

1. 京东零售大模型应用场景

2. 大模型推理服务落地面临的技术挑战

3. 推理服务核心优化技术

  • 技术架构与核心功能

  • 请求/实例全局调度

  • 全异步化运行与多层流水线

  • 算子高效执行与显存管理

4. 未来优化方向展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 要求开发者对 CPU/GPU/NPU 高性能编程,以及 LLM/LVM 模型有深刻理解和技术掌握。


您的演讲有哪些前沿亮点?

  • LLM 推理仍面临较大的成本压力,结合用户体验 SLO 要求,如何兼顾高吞吐与低时延目前前沿且迫切要解决的技术难点。


听众收益

  • 了解 LLM 推理在工业界落地的前沿进展、业务落地技术挑战,以及技术解决方案。


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-11 13:003934

评论

发布
暂无评论

Python爬虫实战:根据关键字爬取某度图片批量下载到本地(附上完整源码)

袁袁袁袁满

Python 爬虫案例

开启AI创新之旅!“华为云杯”2023人工智能应用创新大赛

科技热闻

我们招聘啦!(Java、测试、后端)

数新网络官方账号

大数据 数据仓库 企业招聘

在探索的道路上持续“做对”,火山引擎A/B测试成为这家企业数字基建

字节跳动数据平台

大数据 A/B 测试 企业号 8 月 PK 榜

代码随想录Day45 - 动态规划(七)

jjn0703

在 Go 中如何编写出可测试的代码

江湖十年

golang 后端 单元测试

Snagit 中文for mac(强大的屏幕截图工具) 2023.2.2

胖墩儿不胖y

Mac软件 截图工具 屏幕截图

Kafka 开飙了!5分钟,带你体验一把“速度与激情”

java易二三

Java Docker 计算机

稳定高效!NineData x SelectDB 完成产品兼容互认证

NineData

数据管理 大数据分析 SelectDB NineData 产品兼容互认证

python通过将py文件转为so实现代码加密

关耳

Python

25. matplotlib

茶桁

Python matplotlib

手机直播源码开发,协议讨论篇(三):RTMP实时消息传输协议

山东布谷科技

软件开发 RTMP 源码搭建 手机直播源码 实时消息传输协议

2023上海国际智慧停车展览会

AIOTE智博会

城博会 智慧停车展 智慧停车展会 智慧停车博览会

使用Dubbo这么久,才知道这些功能竟如此“亮眼”

java易二三

程序员 dubbo 计算机

将整python项目的代码中的py文件转为so

关耳

Python

MySQL : 好好学习一下InnoDB中的页

java易二三

Java MySQL 数据库 程序员 计算机

MySQL运行时的可观测性

GreatSQL

数据库 greatsql

Nautilus Chain 主网上线拉开模块化序幕,一文纵览生态项目

鳄鱼视界

如何在SAM时代下打造高效的高性能计算大模型训练平台

GPU算力

Nginx No, Traefik Yes

newbe36524

校源行丨开放原子开源基金会赴南大和南理工走访交流

开放原子开源基金会

开源

软件测试/测试开发丨Pytest结合数据驱动

测试人

Python 程序员 软件测试 数据驱动 pytest

2023 年第 33 周 ARTS 打卡

Bryan

Presto 设计与实现(五):自动配置

冰心的小屋

数据湖 自动配置 presto 设计与实现

ARTS2334

okokabcd

IPD(集成产品开发)与CMMI的对比

禅道项目管理

京东零售大模型推理优化实践|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章