写点什么

北京邮电大学副教授、博士生导师徐梦炜博士确认出席 QCon 上海,分享终端大模型操作系统的架构、优化与展望

  • 2025-09-05
    北京
  • 本文字数:1176 字

    阅读完需:约 4 分钟

大小:632.43K时长:03:35
北京邮电大学副教授、博士生导师徐梦炜博士确认出席 QCon 上海,分享终端大模型操作系统的架构、优化与展望

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon 全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


北京邮电大学副教授、博士生导师徐梦炜博士已确认出席并发表题为终端大模型操作系统的架构、优化与展望的主题分享。通过本地化搭载大模型,终端设备的智能能力将获得飞跃式提升,铸造移动计算的下一个黄金时代,对学术界和产业界都是巨大的机遇。为了更好地适应这个过程中上层应用编程接口、用户交互范式、底层资源管理的重要变化,操作系统可能会被重新定义和改写。面向以大模型能力为核心的未来智能终端硬件,本次演讲将介绍团队在大模型操作系统设计和优化方向的思考和尝试,包括 GUI/API 终端智能体构建、面向 NPU 的端侧大模型推理优化加速等。



徐梦炜博士,北京邮电大学副教授、博士生导师,在端侧智能方向发表 CCF-A 类论文 30 余篇,获 USENIX ATC 2024 最佳论文奖等,入选中国科协青托、北京市科技新星、微软研究院“铸星计划”等,主导了开源端侧大模型推理引擎 mllm 等。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景

  • 以大模型为核心的终端硬件发展

  • 为什么需要一个新的操作系统

2. 构建大模型操作系统的主要技术挑战

  • 面向上层智能体应用的易用接口

  • 面向受限硬件资源的高效调度

3. 技术尝试

  • GUI/API 系统级智能体

  • 面向 NPU 的端侧大模型推理优化加速

  • 端侧 KV Cache 高效压缩和管理

4. 未来展望

  • 演化路径和关键节点

  • 学术研究和产业机遇


您认为,这样的技术在实践过程中有哪些痛点?

  • 具体未来大模型操作系统的发展需要结合场景、硬件形态、模型能力发展来看,本次演讲内容偏展望性质


演讲亮点

  • 较为前沿,偏算法-系统-硬件垂直整合


听众收益

  • 了解学术界对端侧大模型的前沿尝试和思考

  • 碰撞大模型操作系统相关思想火花


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-05 14:017585

评论

发布
暂无评论

当量子计算遇上人工智能

启科量子开发者官方号

人工智能 算力 量子计算

OpenHarmony—内核对象事件之源码详解

OpenHarmony开发者

Open Harmony

Web3.0时代来了,看天翼云存储资源盘活系统如何赋能新基建(上)

天翼云开发者社区

区块链 Web

中能融合携手天翼云打造“能源大脑”

天翼云开发者社区

云计算 大数据 安全

CRM 全栈开发工具 WebClient UI Workbench 的设计细节介绍

汪子熙

CRM webUI SAP 全栈开发 6月月更

AI落地的新范式,就“藏”在下一场软件基础设施的重大升级里

九章云极DataCanvas

物联网低代码平台常用《组件介绍》

AIRIOT

低代码 物联网 低代码开发平台 低代码平台 低代码,项目开发

叮!Techo Day 腾讯技术开放日如约而至!

CODING DevOps

CODING DevOps Cloud Studio Techo 腾讯技术开放日

讲师征集令 | Apache DolphinScheduler Meetup分享嘉宾,期待你的议题和声音!

白鲸开源

Apache 大数据 开源 workflow dolpinsheduler

字节跳动数据平台技术揭秘:基于ClickHouse的复杂查询实现与优化

字节跳动数据平台

Clickhouse

使用 Open Connector 进行 HubSpot 和 SAP 系统的集成工作

汪子熙

云原生 系统集成 SAP 6月月更 open-connector

Wallys/4×4 MU-MIMO 6GHz QCN9074 Single Band Wireless Module

wallys-wifi6

NFT质押LP流动性挖矿系统开发详情

开发微hkkf5566

wallys/DR7915-wifi6-MT7915-MT7975-2T2R-support-OpenWRT-802.11AX-supporting-MiniPCIe-Module

wallys-wifi6

后端开发—10个小技巧教你保证线程安全

C++后台开发

线程 多线程 后端开发 linux开发 C++开发

跟着官方文档学 Python 之:解释器和IDE

甜甜的白桃

Python pycharm IDLE 6月月更

疫情之下,元宇宙游戏开发设计如何发展?

开源直播系统源码

游戏开发 元宇宙

CODING DevOps 助力中化信息打造新一代研效平台,驱动“线上中化”新未来

CODING DevOps

持续集成 CODING DevOps 项目协同 合作 中化信息

征文投稿丨使用轻量应用服务器搭建博客环境

阿里云弹性计算

MySQL nginx 博客 Node 轻量应用服务器

Geoffrey Hinton:我的五十年深度学习生涯与研究心法

OneFlow

人工智能 机器学习 深度学习

VPS是干嘛用的?有哪些知名牌子?与云服务器有什么区别?

行云管家

运维 等保备案 VPS

等保备案主体是谁?在当地网安进行备案是吗?

行云管家

等保 等级保护 等保备案

openGauss内核:SQL解析过程分析

华为云开发者联盟

数据库 sql 后端

大神详解开源 BUFF 增益攻略丨直播讲座

Apache IoTDB

开源 面试 求职 秋招 线上讲座

有哪些好用的供应商管理系统

优秀

低代码 数字化转型 供应商管理

使用Karmada实现Helm应用的跨集群部署

华为云开发者联盟

云原生 后端

云上竞技,360°见证速度与激情

天翼云开发者社区

浅谈 SAP 软件里的价格折扣设计原理

汪子熙

SAP ERP pricing 企业管理软件 6月月更

3. Caller 服务调用 - dapr

MASA技术团队

C# .net 框架 Framework dapr

代理类型升级,APISIX 支持 Kafka 作为上游

API7.ai 技术团队

kafka 后端 代理 网关 APISIX 网关

高并发、高可用、弹性扩展,天翼云护航企业云上业务

天翼云开发者社区

云计算 服务器

北京邮电大学副教授、博士生导师徐梦炜博士确认出席 QCon 上海,分享终端大模型操作系统的架构、优化与展望_AI&大模型_QCon全球软件开发大会_InfoQ精选文章