50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

无问芯穹总经理曾书霖博士已确认出席 QCon 上海站,分享 AI 2.0 时代的大模型推理:从模型到硬件的协同优化

  • 2025-09-29
    北京
  • 本文字数:1506 字

    阅读完需:约 5 分钟

大小:823.54K时长:04:41
无问芯穹总经理曾书霖博士已确认出席QCon 上海站,分享AI 2.0 时代的大模型推理:从模型到硬件的协同优化

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


无问芯穹总经理曾书霖博士已确认出席并发表题为AI 2.0 时代的大模型推理:从模型到硬件的协同优化的主题分享,探讨 AI 2.0 模型对算力和数据的需求激增,导致硬件系统的能耗开销逐渐“供不应求”,亟需软硬协同为 AI 行业提供高质量的 AI 系统能效( Tokens/J) 。本次演讲将介绍软硬件协同优化以提升智能系统能效的研究成果,包括模型稀疏量化压缩、高效推理系统设计与大模型加速器设计。并且结合华为昇腾集群的工程实践,探讨下一代 AI 推理系统的演进趋势。



曾书霖,上海无问芯穹智能科技有限公司总经理。于 2018 年和 2023 年在清华大学电子工程系获得工学学士和博士学位,师从清华大学电子工程系系主任、IEEE Fellow 汪玉教授,研究领域为软硬协同优化研究和 AI 加速器设计。在相关领域发表高水平国际会议和期刊论文 20 余篇,谷歌学术施引九百余次,包括以第一作者或共同一作发表高水平论文于可重构计算领域旗舰会议( FPGA · 25, FPGA · 24)、体系结构领域顶级会议 (HPCA · 25, MICRO · 23)、以及顶级期刊 IEEE TC、ACM TRETS 等。曾获 FPGA 2025 会议最佳论文奖( FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,也是亚太国家团队首次获此殊荣)、IEEE TC 2023 Featured Paper of the Month、清华大学研究生国家奖学金等。在创新创业方面,作为创始成员参与创立上海无问芯穹智能科技有限公司,并作为智能终端业务负责人,带领团队打造“端模型 + 端软件 + 端 IP ”的智能终端一体化解决方案。他在本次会议的详细演讲内容如下:


演讲提纲

1. 大模型推理从 Token 到价值

  • 人工智能发展历程回顾

  • Tokens 作为生产要素的关键

  • Tokens 实现产业价值的分析

2. 大模型推理的软硬件协同优化层次

  • 能效指标的变化

  • AI 2.0 的关键指标:高质量 Tokens/J

  • 高质量能效优化的现状与路径

  • 人工智能软硬件分层

3. 多层次优化技术

  • 模型压缩:混合量化与稀疏注意力

  • 推理加速:PD 半融合加速范式与投机早退加速

  • 硬件架构:文生文与文生视频加速器

4. 华为昇腾大模型推理加速实践

  • 现状与挑战

  • 工程实践

  • 未来展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 模型规模激增与硬件算力、能效矛盾加剧

  • 软件栈与硬件特性难以对齐,工程落地复杂


演讲亮点

  • 首提“ 高质量 Tokens/J ”指标,重塑能效评价体系

  • 从模型、系统到硬件的全栈协同优化实践


听众收益

  • 掌握提升大模型推理能效的系统性方法

  • 了解 AI 推理能效的演进方向,提前布局系统架构升级


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-29 13:003869

评论

发布
暂无评论

2049 数据合规可信计划共同体研讨会在京召开,易观作为标准起草单位应邀参加

易观分析

数据 数字化

LED显示屏配电柜专业知识

Dylan

系统、 电子 LED显示屏

开发者进阶必备的9个Tips & Tricks!

SEAL安全

开发者 企业号 3 月 PK 榜 开发人员

全局视角看技术-Java多线程演进史

京东科技开发者

jdk 多线程 Thread 企业号 3 月 PK 榜

OpenCloudOS 如何以最小成本,高效定位内存泄露路径?

OpenCloudOS

Linux 内存 opencloudOS

简述XML和JSON

devpoint

JavaScript json xml

一天约了4个面试,复盘一下面试题和薪资福利

王中阳Go

Go 面试 面试题 简历优化 大厂突击

再创佳绩!阿里云 4 篇论文入选顶会 FAST 2023

云布道师

阿里云 云存储

面试官:你了解Spring Security 权限控制吗?

Java spring spring security

接口优化的常见方案实战总结

京东科技开发者

批处理 预处理 企业号 3 月 PK 榜 接口优化 异步处理

探究计算机视觉新兴能力:如何通过提示检索提高性能?

Zilliz

计算机视觉

从 Netflix 传奇看,结果导向的产品路线图如何制定?(下篇)

LigaAI

敏捷开发 研发管理 研发效能 it路线图 企业号 3 月 PK 榜

小程序成生活“标配”,成互联网商业的重要阵地

没有用户名丶

小程序化

豆瓣评分9.0!《Java核心技术与面试》神作,已助1374人拿到Offer

Java java面试 Java八股文 Java面试题 Java面试八股文

会声会影2023官方新功能介绍

茶色酒

会声会影2023

架构训练营模块八作业

现在不学习马上变垃圾

架构训练营10期

MATLAB实现图像的傅立叶变换

timerring

图像处理

AIGC新实践:AI代写神器搞定BI计算字段所有难题

网易数帆

AI BI

运维训练营第16周作业

好吃不贵

手写模拟Spring底层原理-Bean的创建与获取

京东科技开发者

spring 接口 aop 代码 bean

干货分享!PCBA元器件间距的可焊性设计

华秋电子

图数据库认证考试 NGCP 错题解析 vol.02:这 10 道题竟无一人全部答对

NebulaGraph

图数据库

如何通过C#/VB.NET代码在Word中更改字体颜色

在下毛毛雨

C# .net word文档 字体 段落

大厂的职级晋升答辩是什么 · 职级晋升系列

致知Fighting

后端 晋升

王者荣耀商城异地多活架构设计

Geek_7d539e

浅谈ChatGPT掀起的一波浪潮 | 社区征文

闫同学

ChatGPT

软件测试/测试开发 | 功能测试转测试开发,该如何写简历?如何与其他竞争者中脱颖而出?

测试人

软件测试 自动化测试 测试开发

服务老是被攻击,如何设计一套比较安全的接口访问策略?

中移链元交易功能对接说明

BSN研习社

MYSQL索引知识大集合

阿呆

索引 MySQL InnoDB

无问芯穹总经理曾书霖博士已确认出席QCon 上海站,分享AI 2.0 时代的大模型推理:从模型到硬件的协同优化_AI&大模型_QCon全球软件开发大会_InfoQ精选文章