写点什么

京东零售大模型推理优化实践|AICon 北京

  • 2025-06-11
    北京
  • 本文字数:927 字

    阅读完需:约 3 分钟

大小:523.27K时长:02:58
京东零售大模型推理优化实践|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


京东零售 AI 架构师杨培军已确认出席并发表题为《京东零售大模型推理优化实践》的主题分享。随着 DeepSeek 的爆火,其卓越的性能和成本引起了科技界的广泛关注,同时经过一两年的技术发展,LLM 推理加速与部署进入深水区。LLM 模型在京东零售内部有大量面向 C 端用户、B 端商家和广告主系统等的落地应用,业务场景提出了较高的 SLO 要求和成本压力,如何兼顾高吞吐与低时延是迫切要解决的问题。本次演讲将展开介绍这其中面临的技术挑战和核心技术要点,分享可落地的优化实践经验。



杨培军目前担任京东零售 AI 域架构师,长期从事深度学习和搜推广架构相关方向,擅长深度学习平台、CTR 稀疏和 LLM/LVM 稠密推理加速等领域,曾就职于阿里妈妈和 Bigo 负责机器学习相关平台的建设。他在本次会议的详细演讲内容如下:


演讲提纲

1. 京东零售大模型应用场景

2. 大模型推理服务落地面临的技术挑战

3. 推理服务核心优化技术

  • 技术架构与核心功能

  • 请求/实例全局调度

  • 全异步化运行与多层流水线

  • 算子高效执行与显存管理

4. 未来优化方向展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 要求开发者对 CPU/GPU/NPU 高性能编程,以及 LLM/LVM 模型有深刻理解和技术掌握。


您的演讲有哪些前沿亮点?

  • LLM 推理仍面临较大的成本压力,结合用户体验 SLO 要求,如何兼顾高吞吐与低时延目前前沿且迫切要解决的技术难点。


听众收益

  • 了解 LLM 推理在工业界落地的前沿进展、业务落地技术挑战,以及技术解决方案。


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-11 13:003634

评论

发布
暂无评论

原来你是这样的B+树

Java技术宝典

B+树

区块链+收藏品,全球三种典型应用路径的差异化

CECBC

区块链 应用价值

知路,然后智行远;懂行,所以万业兴

脑极体

如何对 ElasticSearch 集群进行压力测试

白宦成

elasticsearch ELK Elastic Stack

troubleshoot之:用control+break解决线程死锁问题

程序那些事

Java JVM 死锁

2.1.2 类加载器的工作原理与自定义加载器 -《SSM深入解析与项目实战》

谙忆

JDK1.8新特性(七):默认方法,真香,开动!接口?我要升级!!

xcbeyond

接口 新特性 JDK1.8 默认方法 JDK1.8新特性

Go: 互斥锁和饥饿

陈思敏捷

mutex Go 语言

机器学习算法之——K最近邻(k-Nearest Neighbor,KNN)分类算法原理讲解

迈微AI研发社

学习 算法 KNN K聚类

HTTPS证书过期导致的故障

焦振清

运维 https SRE 服务故障 证书过期

多省市出台关于区块链人才引进的计划

CECBC

新基建 区块链技术

你为什么还在用存储过程?

架构师修行之路

数据库设计 架构设计

DevOps 技术栈

柴锋

Linux DevOps 运维 敏捷 Shell

List 和 Map 的排序

一盐难进

Java

机器学习算法之——卷积神经网络(CNN)原理讲解

迈微AI研发社

学习 算法 卷积神经网络 CNN

区块链跃升各国创新战略

CECBC

新基建 国家战略 区块链标准

Kafka处理请求的全流程解析

yes

kafka 面试 后端 消息队列 源码解析

数据库的乐观锁和悲观锁并非真实的锁

架构师修行之路

数据库 架构 乐观锁 悲观锁 分布式锁

踩坑记 | Flutter升级影响了NestedScrollView?

哈利迪

android

真正的勇士,会跨过六道裂谷,奔向云与AI的彼端

脑极体

ARTS Week8

丽子

# spring boot自定义线程池进行异步调用

一盐难进

Java

基于 grpc,protobuf搭建 server/client模型通信

是老郭啊

ARTS-week-2

saddamwilson

ARTS 打卡计划

2.2.1 类反射 -《SSM深入解析与项目实战》

谙忆

LeetCode题解:21. 合并两个有序链表,利用数组排序,JavaScript,详细注释

Lee Chen

大前端 LeetCode

LeetCode题解:24. 两两交换链表中的节点,递归,JavaScript,详细注释

Lee Chen

大前端 LeetCode

从数据中台到AI中台,企业到底要建什么中台?

脑极体

服务器与普通电脑的区别?

德胜网络-阳

如何设计实现一个证书加密签名工具包

三尾鱼

如何理解Java8 的函数式编程

Rayjun

Java 函数式编程

京东零售大模型推理优化实践|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章