2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

商汤副总监龚睿昊确认出席 AICon 北京站,分享大模型推理系统与压缩优化

  • 2025-11-03
    北京
  • 本文字数:1180 字

    阅读完需:约 4 分钟

商汤副总监龚睿昊确认出席AICon北京站,分享大模型推理系统与压缩优化

12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


商汤副总监龚睿昊已确认出席并将在「大模型推理优化与边缘 AI 部署」专题发表题为大模型推理系统与压缩优化:从算法到工具的工程实践的主题分享。大模型时代的模型生产成本更加高昂,模型尺寸大、并行规模大、服务并发高,体系化的大模型工具链和系统对于提升模型迭代和研发效率至关重要。


本次演讲将分享在大模型工具和系统建设的实践经验,介绍搭建的大模型训练、压缩和推理部署系列工具,覆盖多种模态和场景,通过分析阐述其中的相关算法创新与系统实现原理,汇报团队在多种模态大模型的训练系统优化、模型压缩算法和大规模并行服务上的系列探索。


龚睿昊是商汤科技研究院大模型工具体系团队负责人,主要负责工业级模型工具链,包括大规模模型训练、多平台部署、模型压缩和软硬件协同技术体系。通过算法和工具实现规模化工业落地,支持智慧城市、智能驾驶、AIOT、手机场景等大量业务模型的模型生产,团队支撑了商量等商汤大模型体系的底层技术搭建,致力于 ML+System 的综合效率提升。在 ICLR、NeuIPS、CVPR、ICCV、IJCV 等期刊会议发表四十余篇论文,多次获得低功耗计算机视觉比赛 LPCV 冠军、无人机追逐赛亚军等奖项。他在本次会议的详细演讲内容如下:


1. 引言:

○ 视频、图像、语音、语言多种模态生成式大模型推理的系统挑战

○ Light 系列推理工具生态

2. 核心技术解析:

○ 多进程架构:模态伸缩与扩展

○ 多维度压缩方法:量化、Token Pruning、稀疏和 Cache 复用

○ 动态扩缩容:大规模服务的实时弹性扩缩容设计

○ Triton 算子:全面灵活的算子库

3. 应用案例

○ 视频生成民主化:个人玩家的福音

○ 规模服务的降本:组合拳的成本控制

4. 未来展望:

○ 统一模态的融合设计

○ 应用层的系统打通

听众收益:

○ 快速了解生成式大模型的核心推理优化技术,掌握各种模态类型的优化异同点,并理解领域发展的最新趋势


除此之外,本次大会还策划了LLM 时代的软件研发新范式Context EngineeringData+AI / Agent 落地实践大模型系统工程企业级 Agent 的设计与落地大模型时代下的搜广推系统实践多模态从技术突破到创新应用落地等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 8 折优惠,单张门票立省 1160 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-11-03 15:571

评论

发布
暂无评论

Spring IOC

武师叔

7月月更

图解网络:什么是DHCP动态主机配置协议?

wljslmz

网络协议 DHCP 网络技术 7月月更

应用上容器云的准入条件和最佳实践

穿过生命散发芬芳

7月月更 应用上云

初始Envoy项目

阿泽🧸

envoy 7月月更

模块六作业 - 拆分电商系统为微服务

Python 入门指南之输入和输出

海拥(haiyong.site)

7月月更

拆分电商系统为微服务

joak

怎样的工作要辞职呢?

KEY.L

7月月更

闭包

Jason199

js 闭包要点 闭包函数 7月月更

leetcode 932. Beautiful Array 漂亮数组(中等)

okokabcd

LeetCode 分治 算法与数据结构

IoT物联网安全架构设计方案

明亮安全观

网络安全 IoT IoT安全

【愚公系列】2022年07月 Java教学课程 02-Java语言JRE和JDK

愚公搬代码

7月月更

【C语言深度剖析】详解strlen与sizeof的区别及用法

Albert Edison

7月月更

如果设计业务微服务架构 - 作业

阿拉阿拉幽幽

电商微服务

intelamd

《MySQL入门很轻松》第4章:数据表的创建修改删除

乌龟哥哥

7月月更

OKALEIDO:我们为何如此看好多媒体NFT板块?

股市老人

康威定律如何解释微服务的合理性

源字节1号

程序员 软件开发

【Python技能树共建】python selectolax 模块 & Python爬虫模拟登录

梦想橡皮擦

Python 爬虫 7月月更

OKALEIDO:我们为何如此看好多媒体NFT板块?

鳄鱼视界

计算机操作系统之进程与线程

未见花闻

7月月更

5G NR RRC协议总体介绍

柒号华仔

5G 7月月更

OKALEIDO:我们为何如此看好多媒体NFT板块?

西柚子

Qt | 定时器的使用 QTimer

YOLO.

定时器 qt 7月月更

Python Asyncio 初探:基本概念和模式

宇宙之一粟

Python asyncio 7月月更

spring篇之属性注入

邱学喆

spring 属性注入 @Autowired注入原理 @Resource注入原理 @Qualifier

Ark UI中的问题汇总【系列1】

坚果

Open HarmonyOS OpenHarmony Open Harmony 7月月更

拆分电商系统为微服务

爱晒太阳的大白

Binder驱动

北洋

Andriod 7月月更

商汤副总监龚睿昊确认出席AICon北京站,分享大模型推理系统与压缩优化_后端_AICon 全球人工智能开发与应用大会_InfoQ精选文章