写点什么

京东零售大模型推理优化实践|AICon 北京

  • 2025-06-11
    北京
  • 本文字数:927 字

    阅读完需:约 3 分钟

大小:523.27K时长:02:58
京东零售大模型推理优化实践|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


京东零售 AI 架构师杨培军已确认出席并发表题为《京东零售大模型推理优化实践》的主题分享。随着 DeepSeek 的爆火,其卓越的性能和成本引起了科技界的广泛关注,同时经过一两年的技术发展,LLM 推理加速与部署进入深水区。LLM 模型在京东零售内部有大量面向 C 端用户、B 端商家和广告主系统等的落地应用,业务场景提出了较高的 SLO 要求和成本压力,如何兼顾高吞吐与低时延是迫切要解决的问题。本次演讲将展开介绍这其中面临的技术挑战和核心技术要点,分享可落地的优化实践经验。



杨培军目前担任京东零售 AI 域架构师,长期从事深度学习和搜推广架构相关方向,擅长深度学习平台、CTR 稀疏和 LLM/LVM 稠密推理加速等领域,曾就职于阿里妈妈和 Bigo 负责机器学习相关平台的建设。他在本次会议的详细演讲内容如下:


演讲提纲

1. 京东零售大模型应用场景

2. 大模型推理服务落地面临的技术挑战

3. 推理服务核心优化技术

  • 技术架构与核心功能

  • 请求/实例全局调度

  • 全异步化运行与多层流水线

  • 算子高效执行与显存管理

4. 未来优化方向展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 要求开发者对 CPU/GPU/NPU 高性能编程,以及 LLM/LVM 模型有深刻理解和技术掌握。


您的演讲有哪些前沿亮点?

  • LLM 推理仍面临较大的成本压力,结合用户体验 SLO 要求,如何兼顾高吞吐与低时延目前前沿且迫切要解决的技术难点。


听众收益

  • 了解 LLM 推理在工业界落地的前沿进展、业务落地技术挑战,以及技术解决方案。


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-11 13:003744

评论

发布
暂无评论

今天社区团购了吗?

lenka

5月日更

如何使用Putty登录安装在VirtualBox里的ubuntu

汪子熙

ubuntu windows 虚拟机

Dubbo 令牌验证和优雅停机

青年IT男

dubbo

如何查看某个用户指定时间段的ABAP开发记录

汪子熙

SAP abap SAPGUI

如何将iso文件安装到Virtual里的ubuntu去

汪子熙

Linux ubuntu windows 虚拟机 Windows 10

如何给VirtualBox虚拟机的ubuntu LVM分区扩容

汪子熙

虚拟机 Cloud virtualbox CloudFoundry

架构训练营模块四作业

Neil43

架构训练营

千万级学生管理系统的考试试卷存储方案

Lane

优化docker镜像的几种方法

运维研习社

Docker 镜像 优化技巧 5月日更

sap.ui.require in SAP UI5 and require in nodejs

汪子熙

nodejs SAP SAP UI5

ABAP的include关键字,Java的import, C的include和C4C ABSL 的import比较

汪子熙

JavaScript nodejs CRM SAP C4C

ABAP宏的调试

汪子熙

调试 SAP abap macro

CRM, C4C和Hybris的工作流简介

汪子熙

CRM SAP C4C Hybris Commerce Cloud

架构实战营 模块四作业

夏日

架构实战营

SAP UI5和CRM WebUI的View和Controller是如何绑定的

汪子熙

CRM SAP abap WebClient UI SAP UI5

SAP UI5, CRM, S/4HANA 和 C4C里的Association, Composition and Aggregation

汪子熙

JavaScript CRM SAP SAP UI5

如何计算并测量ABAP及Java代码的环复杂度Cyclomatic complexity

汪子熙

Java SAP abap

作业 - 设计千万级学生管理系统的考试试卷存储方案

sN0wpeak

架构实战营

会说话的ABAP report

汪子熙

SAP abap SAPGUI

S/4HANA for Customer Management里的搜索分页处理

汪子熙

CRM SAP abap S/4HANA

SAP Fiori里的List是如何做到懒加载Lazy load的

汪子熙

JavaScript SAP Fiori SAP UI5

ABAP的语法高亮是如何在浏览器里显示的

汪子熙

SAP abap SAPGUI 语法高亮

S4HANA和CRM Fiori应用的搜索分页实现

汪子熙

CRM SAP Fiori SAP UI5 S/4HANA

使用ABAP Push Channel(APC)开发的乒乓球游戏,可双打

汪子熙

SAP abap APC

人生算法:做事要闭环

石云升

读书笔记 职场经验 5月日更 人生算法

那些年我用过的SAP IDE

汪子熙

ide SAP abap SAPGUI

过拟合 - DAY13

Qien Z.

5月日更 过拟合

你真的会用ABAP, Java和JavaScript里的constructor么?

汪子熙

JavaScript CRM SAP abap

架构实战营 - 模块四作业

Sun

如何使用SAP Cloud for Customer里的ABSL代码调用Web service

汪子熙

SAP C4C Cloud for Customer

S4CRM和C4C的技术比较

汪子熙

CRM SAP ERP abap Cloud for Customer

京东零售大模型推理优化实践|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章