2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

商汤副总监龚睿昊确认出席 AICon 北京站,分享大模型推理系统与压缩优化

  • 2025-11-03
    北京
  • 本文字数:1180 字

    阅读完需:约 4 分钟

商汤副总监龚睿昊确认出席AICon北京站,分享大模型推理系统与压缩优化

12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


商汤副总监龚睿昊已确认出席并将在「大模型推理优化与边缘 AI 部署」专题发表题为大模型推理系统与压缩优化:从算法到工具的工程实践的主题分享。大模型时代的模型生产成本更加高昂,模型尺寸大、并行规模大、服务并发高,体系化的大模型工具链和系统对于提升模型迭代和研发效率至关重要。


本次演讲将分享在大模型工具和系统建设的实践经验,介绍搭建的大模型训练、压缩和推理部署系列工具,覆盖多种模态和场景,通过分析阐述其中的相关算法创新与系统实现原理,汇报团队在多种模态大模型的训练系统优化、模型压缩算法和大规模并行服务上的系列探索。


龚睿昊是商汤科技研究院大模型工具体系团队负责人,主要负责工业级模型工具链,包括大规模模型训练、多平台部署、模型压缩和软硬件协同技术体系。通过算法和工具实现规模化工业落地,支持智慧城市、智能驾驶、AIOT、手机场景等大量业务模型的模型生产,团队支撑了商量等商汤大模型体系的底层技术搭建,致力于 ML+System 的综合效率提升。在 ICLR、NeuIPS、CVPR、ICCV、IJCV 等期刊会议发表四十余篇论文,多次获得低功耗计算机视觉比赛 LPCV 冠军、无人机追逐赛亚军等奖项。他在本次会议的详细演讲内容如下:


1. 引言:

○ 视频、图像、语音、语言多种模态生成式大模型推理的系统挑战

○ Light 系列推理工具生态

2. 核心技术解析:

○ 多进程架构:模态伸缩与扩展

○ 多维度压缩方法:量化、Token Pruning、稀疏和 Cache 复用

○ 动态扩缩容:大规模服务的实时弹性扩缩容设计

○ Triton 算子:全面灵活的算子库

3. 应用案例

○ 视频生成民主化:个人玩家的福音

○ 规模服务的降本:组合拳的成本控制

4. 未来展望:

○ 统一模态的融合设计

○ 应用层的系统打通

听众收益:

○ 快速了解生成式大模型的核心推理优化技术,掌握各种模态类型的优化异同点,并理解领域发展的最新趋势


除此之外,本次大会还策划了LLM 时代的软件研发新范式Context EngineeringData+AI / Agent 落地实践大模型系统工程企业级 Agent 的设计与落地大模型时代下的搜广推系统实践多模态从技术突破到创新应用落地等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 8 折优惠,单张门票立省 1160 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-11-03 15:575483

评论

发布
暂无评论

python任务调度利器-APScheduler

AIWeker

Python 任务调度 11月月更

关于部署策略的遐思

在天涯的海角

Gradle入门了解

派大星

Gradle

极客时间运维进阶训练营第五周作业

独钓寒江

React源码分析3-render阶段(穿插scheduler和reconciler)

goClient1992

React

规则引擎Drools在贷后催收业务中的应用

vivo互联网技术

drools 规则引擎

以原子化服务为基石,面向三大场景打造鸿蒙软硬协同新体验

最新动态

【web 开发基础】PHP的匿名函数和闭包 (40)

迷彩

闭包 closure web开发基础 匿名函数 11月月更

C++学习---类型萃取---is_pointer && is_lvalue_reference/is_rvalue_reference

桑榆

C++ STL 11月月更

React源码解读之更新的创建

flyzz177

React

React源码解读之任务调度

flyzz177

React

Python操作XML文件

度假的小鱼

11月月更 Python操作xml xml与html区别

【React技术】JSX在企业级项目的运用and一个元素渲染demo

恒山其若陋兮

前端 11月月更

React源码分析1-jsx转换及React.createElement

goClient1992

React

DDD与EDA-核心逻辑提炼方法论

胖子笑西风

Java 架构 DDD 事件驱动 EDA

Python 操作BeautifulSoup4(爬取网页信息)

度假的小鱼

正则 11月月更 Python BeautifulSoup4

Python基础库-json库

度假的小鱼

11月月更 Python操作json json语法规则

EasyRcovery2023绿色免费版U盘数据恢复软件

茶色酒

EasyRcovery2023

信息论与编码:随参信道特性

timerring

11月月更 信息论 移动通信

三分钟了解client-go

穿过生命散发芬芳

Client-go 11月月更

CrossOver2023免费版虚拟机软件安装包下载

茶色酒

CrossOver2023

盘点入职时,那些常见但不合规的操作

石云升

职场 入职 11月月更

React源码解读之React Fiber

flyzz177

React

性能测试知识科普(七):监控能给你带来什么

老张

性能测试 监控指标

JXcore 打包在企业级项目里的合理运用和模块系统以及网络的配置详解【node.js】

恒山其若陋兮

前端 11月月更

我们为什么喜欢看疯狂科学家开飞艇?

脑极体

React源码分析2-深入理解fiber

goClient1992

React

「Go工具箱」gorilla/sessions包的使用及原理分析

Go学堂

golang 深度思考 个人成长 Web 11月月更

一文熟悉 Go 函数

陈明勇

Go golang 闭包 函数 11月月更

CDH5部署三部曲之三:问题总结

程序员欣宸

大数据 hadoop CDH 11月月更

商汤副总监龚睿昊确认出席AICon北京站,分享大模型推理系统与压缩优化_后端_AICon 全球人工智能开发与应用大会_InfoQ精选文章