写点什么

商汤副总监龚睿昊确认出席 AICon 北京站,分享大模型推理系统与压缩优化

  • 2025-11-03
    北京
  • 本文字数:1180 字

    阅读完需:约 4 分钟

商汤副总监龚睿昊确认出席AICon北京站,分享大模型推理系统与压缩优化

12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


商汤副总监龚睿昊已确认出席并将在「大模型推理优化与边缘 AI 部署」专题发表题为大模型推理系统与压缩优化:从算法到工具的工程实践的主题分享。大模型时代的模型生产成本更加高昂,模型尺寸大、并行规模大、服务并发高,体系化的大模型工具链和系统对于提升模型迭代和研发效率至关重要。


本次演讲将分享在大模型工具和系统建设的实践经验,介绍搭建的大模型训练、压缩和推理部署系列工具,覆盖多种模态和场景,通过分析阐述其中的相关算法创新与系统实现原理,汇报团队在多种模态大模型的训练系统优化、模型压缩算法和大规模并行服务上的系列探索。


龚睿昊是商汤科技研究院大模型工具体系团队负责人,主要负责工业级模型工具链,包括大规模模型训练、多平台部署、模型压缩和软硬件协同技术体系。通过算法和工具实现规模化工业落地,支持智慧城市、智能驾驶、AIOT、手机场景等大量业务模型的模型生产,团队支撑了商量等商汤大模型体系的底层技术搭建,致力于 ML+System 的综合效率提升。在 ICLR、NeuIPS、CVPR、ICCV、IJCV 等期刊会议发表四十余篇论文,多次获得低功耗计算机视觉比赛 LPCV 冠军、无人机追逐赛亚军等奖项。他在本次会议的详细演讲内容如下:


1. 引言:

○ 视频、图像、语音、语言多种模态生成式大模型推理的系统挑战

○ Light 系列推理工具生态

2. 核心技术解析:

○ 多进程架构:模态伸缩与扩展

○ 多维度压缩方法:量化、Token Pruning、稀疏和 Cache 复用

○ 动态扩缩容:大规模服务的实时弹性扩缩容设计

○ Triton 算子:全面灵活的算子库

3. 应用案例

○ 视频生成民主化:个人玩家的福音

○ 规模服务的降本:组合拳的成本控制

4. 未来展望:

○ 统一模态的融合设计

○ 应用层的系统打通

听众收益:

○ 快速了解生成式大模型的核心推理优化技术,掌握各种模态类型的优化异同点,并理解领域发展的最新趋势


除此之外,本次大会还策划了LLM 时代的软件研发新范式Context EngineeringData+AI / Agent 落地实践大模型系统工程企业级 Agent 的设计与落地大模型时代下的搜广推系统实践多模态从技术突破到创新应用落地等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 8 折优惠,单张门票立省 1160 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-11-03 15:575758

评论

发布
暂无评论

TinyVue v3.19.0 正式发布!Tree 组件终于支持虚拟滚动啦!

OpenTiny社区

开源 前端 组件库 OpenTiny TinyVue

鸿蒙网络编程系列45-仓颉版HTTPS证书自选CA校验示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙网络编程系列46-仓颉版Web组件加载网页的三种方式

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

比特币价格飙升的背后:多重因素的综合分析

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 公链开发代币开发

企业在财务规划过程中,如何避免零基预算的常见陷阱

智达方通

零基预算 财务规划

用户参与的力量:提升软件开发项目的用户参与度

易成研发中心

项目管理 程序员 软件项目

日照等保测评机构有哪些?电话多少?

行云管家

等保 堡垒机 日照

大数据行业怎么定义?是否需要堡垒机?

行云管家

大数据 堡垒机 大数据行业

怎么在ppt中替换字体?分享3个ppt必备的使用技巧!

职场工具箱

效率工具 职场 PPT 办公软件 AI生成PPT

OpenAI 再发 Sora 新短片,传 Sora 两周内推出;李飞飞团队出品空间智能版 ImageNet丨 RTE 开发者日报

RTE开发者社区

TapData 「邀请函」:前方组队乘风破浪中,要一起加入吗?

tapdata

深圳招聘 生态渠道负责人 销售招聘 SaaS产品海外运营经理 Python开发工程师

全面解析交易所开发:源码、搭建公司选择与开发费用

区块链软件开发推广运营

交易所开发 链游开发 钱包开发 链游开发dapp开发 链游开发dapp开发公链开发

《深入浅出Apache Spark》系列②:Spark SQL原理精髓全解析

数新网络官方账号

sql

BOM是什么?怎么创建BOM?BOM有什么分类?

积木链小链

ERP BOM ERP软件

商汤副总监龚睿昊确认出席AICon北京站,分享大模型推理系统与压缩优化_后端_AICon 全球人工智能开发与应用大会_InfoQ精选文章