大咖直播-鸿蒙原生开发与智能提效实战!>>> 了解详情
写点什么

破局终端算力墙:支付宝 xNN-LLM 的端侧大模型实践|QCon 上海

  • 2025-09-07
    北京
  • 本文字数:1963 字

    阅读完需:约 6 分钟

大小:1.03M时长:06:01
破局终端算力墙:支付宝 xNN-LLM 的端侧大模型实践|QCon 上海

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon 全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


蚂蚁集团 xNN 引擎负责人、支付宝多模态应用实验室研究员朱世艾博士已确认出席并发表题为破局终端算力墙:支付宝 xNN-LLM 的端侧大模型实践的主题分享。大模型的能力结合端侧 AI 在体验、成本与隐私保护方面的优势,对于业务应用无疑有着巨大的吸引力。我们可喜的看到终端大模型在各个新款手机上已经有了很好的落地案例,这之中汇聚了基础模型研发、硬件支持和系统层生态的力量。支付宝 APP 作为应用层重要的一员,端侧 AI 有着广泛的使用场景,面向大模型技术的升级也是亟待解决的问题。


然而其中面临的挑战也是巨大的:


1. APP 需要兼顾不同型号和算力的手机,特别是广泛使用的中端芯片;


2. 相对系统层来说,APP 可以用到的资源相对有限,还要保证上层应用的稳定性;


3. 手机上有着非常碎片化的硬件环境,不同 Backend 的特点不同,一致性难以解决;


4. APP 应用的模型通过网络下发部署,对于模型物理尺寸有着严格要求。


本次演讲将介绍支付宝如何在种种限制条件下以高覆盖和低资源消耗为目标,结合低比特量化和硬件加速实现,构建出了适合 APP 生态的端大模型技术 xNN-LLM。为大家展示这一技术在精度、性能和模型覆盖方面的最新进展,以及在支付宝 APP 中的潜在应用方式。



朱世艾博士,蚂蚁集团 xNN 引擎负责人,支付宝多模态应用实验室研究员。2013 年获得香港城市大学博士学位,之后前往加拿大渥太华大学从事博士后研究,2016 年加入蚂蚁集团,具有十多年算法研发和性能优化经验。在蚂蚁期间,先后担任过新春五福、扫一扫、会员等支付宝多个业务的算法负责人,开发了几乎覆盖所有 CV 类任务的超轻量移动端 AI 算法组件。自 2023 年开始担任支付宝移动端研发框架 xNN 的负责人,主导了面向超级 APP 的端侧大模型技术体系建设,致力于在大模型时代推动端侧 AI 技术的产业应用。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景与挑战

  • 端大模型业界进展:介绍端大模型的发展历程,包括从基模,应用到芯片支持方面的进展

  • APP 端大模型面临的挑战:在 APP 场景中端 AI 处于什么位置,主要应用场景有哪些,大模型时代面临哪些变化。基于以上问题的技术判断有哪些

2. 适合于 APP 场景的低比特量化方案

  • LLM 模型量化方案:在各种条件限制下,需要综合考虑精度、模型尺寸和推理友好,从而构建出 xNN-LLM 低比特量化方案

  • 多模态大模型量化方案:介绍量化算法从 LLM 延伸到多模态场景需要做哪些调整,包括多种可选方案的尝试

  • 量化效果对比:介绍当前量化 Pipeline 在不同模型上的精度水位

3. xNN-LLM 异构推理引擎

  • 推理引擎框架设计:面向大模型推理和应用场景特点的 xNN-LLM 框架设计

  • 模型推理实现:为了提升覆盖率,如何充分发挥手机端的异构计算资源。这里介绍 xNN-LLM 在 CPU、GPU 和 NPU 上的实践经验

4. 端大模型能力有应用展望

  • 能力介绍:当下 APP 端大模型具备什么能力,能完成哪些任务

  • 应用展望:在支付宝 APP 中,可能存在的应用场景和应用形式有哪些

5. 端大模型未来展望

  • 从整个手机生态角度来看,各方在端大模型方面可能的合作和协同机制会是什么样


您认为,这样的技术在实践过程中有哪些痛点?

  • 从能力上来说,机型覆盖和能力覆盖之间的冲突

  • 从运维的角度来看,有限资源下充分的共享带来模型更新复杂度增加

  • 从场景来看,端云结合会是安全稳妥的方案,但是实现复杂度比较


演讲亮点

  • 从 APP 应用角度出发,客观务实的阐述技术方案选型、实现技巧和应用模式


听众收益

  • 具有更为广泛应用场景的 APP 上建设端大模型的思路有什么不同

  • 了解到为什么需要算法和引擎之间进行联合优化

  • 当下端大模型能力边界在哪里,未来可能往哪些方向演进


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-07 10:006263

评论

发布
暂无评论

数智化底座正在成为当前竞争的焦点

用友BIP

数智底座

Mybatis-SQL分析组件 | 京东云技术团队

京东科技开发者

mybatis sql mybatis入门 企业号 7 月 PK 榜

掌握 Dubbo:入门教程

Apifox

程序员 gRPC dubbo RPC 开发

实例讲解看nsenter带你“上帝视角”看网络

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 7 月 PK 榜

Pytorch: autograd与逻辑回归的实现

timerring

人工智能

网易三个S级项目制作人,为什么选择在这个渠道“爆料”?

最新动态

论文解读|TuGraph Analytics 流式图计算论文入选国际顶会 SIGMOD

TuGraphAnalytics

大数据 论文 图计算 SIGMOD GeaFlow

谁在以太坊区块链上循环交易?GeaFlow+Kafka的0元流图解决方案

TuGraphAnalytics

区块链 以太坊 kafka 图计算 GeaFlow

SpringIoc容器之Aware | 京东云技术团队

京东科技开发者

spring aware springloc Aware 接口 企业号 7 月 PK 榜

使用第一性原理思维思考如何打造提高生产力的平台 | 京东云技术团队

京东科技开发者

数字化转型 平台工程 企业号 7 月 PK 榜

一文搞懂Git,掌握日常命令和基本操作

互联网工科生

git 知识

云拨测全面升级丨单次拨测低至 0.001 元

阿里巴巴云原生

阿里云 云原生 可观测 云拨测

基于STM32的300W无刷直流电机驱动方案

元器件秋姐

驱动 无刷电机 直流电机 SMT32 FOC

谈谈分布式事务

Monin

分布式事务 微服务 云原生 事务 java 编程

七月创作之星挑战赛开始咯~

Openlab_cosmoplat

开源 开源社区 创作活动

从大数据到图计算-Graph On BigData

TuGraphAnalytics

GitHub 大数据 开源 图计算 GeaFlow

体系完整的数智化底座支撑企业创新发展,实现国产替代

用友BIP

国产替代

持续推进平台化、生态化用友助力数智化安全有效落地

用友BIP

信创 国产替代

全新技术驱动预算管理全面升级

用友BIP

全面预算

从混沌到秩序的蜕变,SRE解码云计算运维奥秘

鲸品堂

云计算 SRE SRE实践 企业号 7 月 PK 榜

科兴未来|2023“直通乌镇” 全球互联网大赛

科兴未来News

wrk - 本地压测工具实操

Monin

高性能 压测 性能调优 #性能测试 wrk

如果我是一个小白,怎么开发网页

猫九

前端

一辆没有“刹车”的跑车,你敢开多快?

原点安全

数据资产价值 数据安全管理 贴源保护

Kubernetes云原生实战:分布式GeaFlow实现图研发,构建第一个商业智能应用

TuGraphAnalytics

Kubernetes 云原生 k8s BI 商业智能

我感兴趣的技术四剑客 | 社区征文

法医

前端 年中技术盘点

APP流水线测试领域探索与最佳实践 | 京东物流技术团队

京东科技开发者

测试 app测试 app自动化测试 企业号 7 月 PK 榜

华为云GaussDB亮相2023可信数据库发展大会,荣获三项评测证书!

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

CST电磁仿真软件配置的CPU、内存、显卡显存越大越好吗?

思茂信息

cst cst使用教程 cst操作 cst电磁仿真 cst仿真软件

破局终端算力墙:支付宝 xNN-LLM 的端侧大模型实践|QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章