10 月 23 - 25 日,QCon 上海站即将召开,9折优惠最后2天 了解详情
写点什么

无问芯穹总经理曾书霖博士已确认出席 QCon 上海站,分享 AI 2.0 时代的大模型推理:从模型到硬件的协同优化

  • 2025-09-29
    北京
  • 本文字数:1506 字

    阅读完需:约 5 分钟

大小:823.54K时长:04:41
无问芯穹总经理曾书霖博士已确认出席QCon 上海站,分享AI 2.0 时代的大模型推理:从模型到硬件的协同优化

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


无问芯穹总经理曾书霖博士已确认出席并发表题为AI 2.0 时代的大模型推理:从模型到硬件的协同优化的主题分享,探讨 AI 2.0 模型对算力和数据的需求激增,导致硬件系统的能耗开销逐渐“供不应求”,亟需软硬协同为 AI 行业提供高质量的 AI 系统能效( Tokens/J) 。本次演讲将介绍软硬件协同优化以提升智能系统能效的研究成果,包括模型稀疏量化压缩、高效推理系统设计与大模型加速器设计。并且结合华为昇腾集群的工程实践,探讨下一代 AI 推理系统的演进趋势。



曾书霖,上海无问芯穹智能科技有限公司总经理。于 2018 年和 2023 年在清华大学电子工程系获得工学学士和博士学位,师从清华大学电子工程系系主任、IEEE Fellow 汪玉教授,研究领域为软硬协同优化研究和 AI 加速器设计。在相关领域发表高水平国际会议和期刊论文 20 余篇,谷歌学术施引九百余次,包括以第一作者或共同一作发表高水平论文于可重构计算领域旗舰会议( FPGA · 25, FPGA · 24)、体系结构领域顶级会议 (HPCA · 25, MICRO · 23)、以及顶级期刊 IEEE TC、ACM TRETS 等。曾获 FPGA 2025 会议最佳论文奖( FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,也是亚太国家团队首次获此殊荣)、IEEE TC 2023 Featured Paper of the Month、清华大学研究生国家奖学金等。在创新创业方面,作为创始成员参与创立上海无问芯穹智能科技有限公司,并作为智能终端业务负责人,带领团队打造“端模型 + 端软件 + 端 IP ”的智能终端一体化解决方案。他在本次会议的详细演讲内容如下:


演讲提纲

1. 大模型推理从 Token 到价值

  • 人工智能发展历程回顾

  • Tokens 作为生产要素的关键

  • Tokens 实现产业价值的分析

2. 大模型推理的软硬件协同优化层次

  • 能效指标的变化

  • AI 2.0 的关键指标:高质量 Tokens/J

  • 高质量能效优化的现状与路径

  • 人工智能软硬件分层

3. 多层次优化技术

  • 模型压缩:混合量化与稀疏注意力

  • 推理加速:PD 半融合加速范式与投机早退加速

  • 硬件架构:文生文与文生视频加速器

4. 华为昇腾大模型推理加速实践

  • 现状与挑战

  • 工程实践

  • 未来展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 模型规模激增与硬件算力、能效矛盾加剧

  • 软件栈与硬件特性难以对齐,工程落地复杂


演讲亮点

  • 首提“ 高质量 Tokens/J ”指标,重塑能效评价体系

  • 从模型、系统到硬件的全栈协同优化实践


听众收益

  • 掌握提升大模型推理能效的系统性方法

  • 了解 AI 推理能效的演进方向,提前布局系统架构升级


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-29 13:001

评论

发布
暂无评论

MySQL数据库之数据查询

乌龟哥哥

4月月更

合作创新,携手共赢!共筑坚实数字底座!

天翼云开发者社区

系统

天翼云:加速推进云网融合共赢算力时代

天翼云开发者社区

大数据

最新云原生网络技术标准来了,为企业提供基础架构能力权威指南

York

架构 云原生 网络性能

免费IT自动化运维平台- ETL调度批量管理工具 TASKCTL 8.0 作业设计功能使用

敏捷调度TASKCTL

数据仓库 数据治理 运维自动化 ETL任务 TASKCTL

以南大通用为例,讲一讲如何完成与龙蜥操作系统的兼容验证

OpenAnolis小助手

操作系统 龙蜥社区 南大通用 兼容验证

松灵学院 | Scout mini 仿真指南

松灵机器人

人工智能 机器人 ROS 移动机器人

直播预告|企业云原生 IT 成本治理方案解析

阿里巴巴云原生

阿里云 容器 云原生 cncf 直播预告

风险与机遇并存,数据分析厂商如何突围?

ToB行业头条

Sidecar 模式的机制与应用

全象云低代码

Kubernetes 容器 低代码 后端技术 Sidecar

不知道OpenCLA的注意啦!(OpenCLA签署须知)

Jianmu

开源项目 开源社区 建木CI CLA 贡献者许可协议

天翼云Web应用防火墙(边缘云版)拦截WordPress Elementor漏洞的说明

天翼云开发者社区

防火墙

小程序赛道的发展,让智能电视业务发展如虎添翼

Speedoooo

小程序 物联网 IoT 小程序容器 智能电视

直播预告丨Hello HarmonyOS进阶系列课程重磅来袭,4月27日开播

HarmonyOS开发者

HarmonyOS 智能家居 原子化服务

80+产品正通过兼容性测试,OpenHarmony生态落地已初具规模

科技汇

网站的FAQ页面应该怎么写?

小炮

FAQ

一看即会:Serverless 应用开发的 7 个实战小技巧(文末附好礼)

阿里巴巴云原生

阿里云 Serverless 架构 开发者 云原生

工程师们看过来|这是我见过的IT圈最“潮”的产品发布会了!

观测云

程序员 可观测性 产品发布会 IT工程师 监测

RTE NG-Lab:一起探索下一代实时互动新世界

声网

NG-Lab 声网动态

OpenHarmony技术日圆满举行 | 3.1 Release版本重磅发布,生态落地初具规模

OpenHarmony开发者

OpenHarmony 技术日

设计千万级学生管理系统的考试试卷存储方案

锎心😌😌😌

区块链赋能不动产—易居EBaaS在不动产领域应用

BSN研习社

区块链

KPI与360度考核结合的应用落地方案

明道云

OpenHarmony,一路前行,为了奇迹

脑极体

如何通过灵魂复盘大幅降低业务风险?

Samson

技术管理 复盘 事故 SRE 4月月更

全场景式全流程监控,博睿数据为券商IT运维难题提供了范例

博睿数据

测试自动化最佳实践指南

阿里云云效

云计算 阿里云 测试 自动化测试 测试自动化

OpenHarmony技术日成功举办,全球下载次数高达6300万

科技汇

基于Sharding-JDBC的订单分库⽅案

领创集团Advance Intelligence Group

使用车载小程序,共建车联网联合共赢生态

Speedoooo

车联网 物联网 智能设备 小程序容器 车载设备

阿里云人工智能创新发布-工业五金图片搜索

视觉智能

拍照购物 以图搜图 图像搜索 拍立淘

无问芯穹总经理曾书霖博士已确认出席QCon 上海站,分享AI 2.0 时代的大模型推理:从模型到硬件的协同优化_AI&大模型_QCon全球软件开发大会_InfoQ精选文章