9 月 13 日,2025 Inclusion・外滩大会「开源嘉年华」正在限量报名中! 了解详情
写点什么

北京邮电大学副教授、博士生导师徐梦炜博士确认出席 QCon 上海,分享终端大模型操作系统的架构、优化与展望

  • 2025-09-05
    北京
  • 本文字数:1176 字

    阅读完需:约 4 分钟

大小:632.43K时长:03:35
北京邮电大学副教授、博士生导师徐梦炜博士确认出席 QCon 上海,分享终端大模型操作系统的架构、优化与展望

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon 全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


北京邮电大学副教授、博士生导师徐梦炜博士已确认出席并发表题为终端大模型操作系统的架构、优化与展望的主题分享。通过本地化搭载大模型,终端设备的智能能力将获得飞跃式提升,铸造移动计算的下一个黄金时代,对学术界和产业界都是巨大的机遇。为了更好地适应这个过程中上层应用编程接口、用户交互范式、底层资源管理的重要变化,操作系统可能会被重新定义和改写。面向以大模型能力为核心的未来智能终端硬件,本次演讲将介绍团队在大模型操作系统设计和优化方向的思考和尝试,包括 GUI/API 终端智能体构建、面向 NPU 的端侧大模型推理优化加速等。



徐梦炜博士,北京邮电大学副教授、博士生导师,在端侧智能方向发表 CCF-A 类论文 30 余篇,获 USENIX ATC 2024 最佳论文奖等,入选中国科协青托、北京市科技新星、微软研究院“铸星计划”等,主导了开源端侧大模型推理引擎 mllm 等。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景

  • 以大模型为核心的终端硬件发展

  • 为什么需要一个新的操作系统

2. 构建大模型操作系统的主要技术挑战

  • 面向上层智能体应用的易用接口

  • 面向受限硬件资源的高效调度

3. 技术尝试

  • GUI/API 系统级智能体

  • 面向 NPU 的端侧大模型推理优化加速

  • 端侧 KV Cache 高效压缩和管理

4. 未来展望

  • 演化路径和关键节点

  • 学术研究和产业机遇


您认为,这样的技术在实践过程中有哪些痛点?

  • 具体未来大模型操作系统的发展需要结合场景、硬件形态、模型能力发展来看,本次演讲内容偏展望性质


演讲亮点

  • 较为前沿,偏算法-系统-硬件垂直整合


听众收益

  • 了解学术界对端侧大模型的前沿尝试和思考

  • 碰撞大模型操作系统相关思想火花


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-05 14:0110

评论

发布
暂无评论

CDC YAML 在阿里云的最佳实践

Apache Flink

大数据 flink 实时计算 yaml

和鲸分享| 世界500强莫德纳公司首席数据科学家Eric J. Ma:协同数据科学的制胜秘诀!

ModelWhale

Python 人工智能 大数据 R语言 大模型

企业数智化转型:低代码开发的五大优势解析

不在线第一只蜗牛

低代码 数智化

2024年好用的AI工具盘点!办公效率快到飞起!

职场工具箱

人工智能 职场 办公软件 AIGC AI生成PPT

搭建服务端性能监控系统 Prometheus:从零开始的实践指南

测吧(北京)科技有限公司

测试

SD-WAN对MPLS和网络安全的重要意义

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SD-WAN国际专线

淘宝天猫API接口探索:轻松实现商品详情与关键字搜索

代码忍者

API 接口 pinduoduo API

SD-WAN的核心服务能力

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SD-WAN国际专线

鸿蒙NEXT开发中如何确保使用 PersistentStorage 存储的数据安全?

威哥爱编程

HarmonyOS HarmonyOS NEXT

JMeter 实时压测结果收集:高效监控与分析

测吧(北京)科技有限公司

测试

http请求超时, 底层发生了什么?

不在线第一只蜗牛

网络协议 网络 HTTP

单链表与双链表的应用与常见算法

测吧(北京)科技有限公司

测试

美团一面,有点难度

王中阳Go

Go 后端 面试问题

OWASP Top 10 安全漏洞与安全防护体系

测吧(北京)科技有限公司

测试

告别编码难题,JeeLowCode让应用开发更简单!#高效开发

JeeLowCode低代码平台

直播电商,正在被内容逻辑重塑

趣解商业

直播 电商 抖音

数智化赋能龙港中医院,让医疗服务有了“人情味”

Alter

LIFO 后进先出、函数调用的堆与栈的区别

测吧(北京)科技有限公司

测试

MPC2024开幕演讲

明道云

第77期 | GPTSecurity周报

云起无垠

为智算“强心”,为园区“壮体”:新质互联网驶入标准化快车道

脑极体

AI

阴阳怪气的「道歉」背后,是新闻从业者的一次呐喊

TechubNews

Prometheus 监控系统部署应用实战:从零到一

测吧(北京)科技有限公司

测试

经典排序算法:冒泡排序与选择排序

测吧(北京)科技有限公司

测试

确保对象的唯一性实现

测吧(北京)科技有限公司

测试

北京邮电大学副教授、博士生导师徐梦炜博士确认出席 QCon 上海,分享终端大模型操作系统的架构、优化与展望_AI&大模型_QCon全球软件开发大会_InfoQ精选文章