写点什么

从云入端,CANN & Ascend C 助力大模型端侧部署|QCon 上海

  • 2025-09-09
    北京
  • 本文字数:1049 字

    阅读完需:约 3 分钟

大小:569.36K时长:03:14
从云入端,CANN & Ascend C 助力大模型端侧部署|QCon 上海

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon 全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


华为 CANN 端侧生态技术专家章武已确认出席并发表题为从云入端,CANN & Ascend C 助力大模型端侧部署的主题分享。本次演讲将围绕当前端侧大模型日益增长需求,针对华为手机端侧大模型入端技术挑战(人因、内存、存储、功耗等),重点介绍相关创新技术实践和生态开放方案,同时展望未来端云协同技术下端侧大模型能力的演进。


章武,华为 CANN 端侧生态技术专家,深耕华为端侧 AI 计算领域 8 年,主要研究方向高性能计算、大模型推理、硬件建模、端侧 AI 生态。长期从事端侧 AI 生态技术构建,主导与 TOP 互联网 APP 做技术合作和业务上线。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景

  • 端侧大模型应用场景

  • 大模型入端的主要收益

2. 端侧大模型技术的主要挑战

  • 大模型应用的人因体验

  • 内存、存储、算力和功耗多重受限

3. 大模型入端技术创新实践

  • 算法创新(投机、以存代算、token 压缩复用)

  • 模型小型化(量化)

  • 推理加速优化

  • 内存极致压缩复用

4. 大模型能力开放

  • 大模型推理引擎

  • 自定义算子编程 Ascend C

5. 未来展望

  • 端云场景的协同


您认为,这样的技术在实践过程中有哪些痛点?

  • 大模型的端侧推理的内存优化和包体积优化

  • 端侧大模型场景功耗问题


演讲亮点

  • 大模型大模型推理引擎,Ascend C 自定义编程


听众收益

  • 大模型入端技术探索,端云协同,低 bit 量化


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,,详情可联系票务经理 18514549229 咨询。


2025-09-09 11:503904

评论

发布
暂无评论

“AI+Security”系列第3期(一):AI 安全智能体,重塑安全团队工作范式

云起无垠

BOE(京东方)携故宫博物院举办2024“照亮成长路”公益项目落地仪式以创新科技赋能教育可持续发展

科技汇

参与滴滴开源项目,获得精美礼品

XIAOJUSURVEY

GitHub 开源 活动 PR Issue

如何保持telegram电报群活跃?

区块链项目一站式包装孵化

Facebook养号与推广技巧

Ogcloud

facebook 云手机 海外云手机 FB推广 FB引流

海外云手机解决IP、成本、稳定性问题

Ogcloud

云手机 海外云手机 云手机海外版 海外原生IP 海外IP

币圈项目为什么要做cmc+cg(双c)?

区块链项目一站式包装孵化

BPM(业务流程管理)的最佳开源工具

NocoBase

开源 项目管理 低代码 BPM 无代码

总裁,这是一份覆盖50家媒体的区块链发文套餐,请您收下!

区块链项目一站式包装孵化

《中国移动算力网络数据库白皮书》正式发布,NineData叶正盛分享

NineData

数据库 中国移动 叶正盛 NineData 算力网络数据库白皮书

NetFlow Analyzer:精准流量洞察,引领网络安全新纪元

Geek_a83400

mac苹果电脑游戏推荐:暗黑2:毁灭之王 for Mac(含各职业存档)

你的猪会飞吗

Mac游戏下载 Mac游戏推荐

中文区块链媒体自媒体哪些发起来最有性价比?(非权威勿喷)

区块链项目一站式包装孵化

一位架构师的自述:在尚未踏入的世界成为你自己

京东科技开发者

谷歌发布新 RL 方法,性能提升巨大;苹果前设计总监正与 OpenAI 合作开发 AI 设备丨 RTE 开发者日报

声网

“数据思维人才培养论坛” 于大湾区大学举行,和鲸科技受邀共话产教创新路径

ModelWhale

人工智能 大数据 人才培养 高等教育

如何确定性能测试指标

老张

软件测试 性能测试 技术指标 高性能高可用

数据结构与算法之间有何关系?

不在线第一只蜗牛

数据结构 算法

【理论篇】关于聚合根,领域事件的那点事---深入浅出理解DDD

京东科技开发者

如何免费调用有道翻译API实现多语言翻译

幂简集成

翻译软件 API

漆包线工厂生产管理MES系统功能介绍

万界星空科技

mes 万界星空科技 漆包线mes 铜线mes 漆包线

中国可观测日「成都站」圆满落幕

观测云

可观测性

【XIAOJUSURVEY& 北大】实现数据导出的前后端全流程

XIAOJUSURVEY

数据分析 Vue Node 问卷 数据导出

AI赋能美好生活,OpenVINO™技术成果助力多领域发展

E科讯

精彩回顾|博睿数据Bonree ONE 3.0产品发布会圆满落幕:三城联动 共襄盛举!

博睿数据

SaaS业务架构:业务能力分析

不在线第一只蜗牛

架构 SaaS

座无虚席!首期流程挖掘实践训练营火爆收官

望繁信科技

数字化转型 流程挖掘 流程资产 流程智能 望繁信科技

Yihong,从多元职业到代码之路 | MarsCoders 开发者说

TRAE.ai

Python 人工智能 编程 程序员 AI

从云入端,CANN & Ascend C 助力大模型端侧部署|QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章