阿里云飞天发布时刻,领先大模型限免,超7000万 tokens免费体验 了解详情
写点什么

vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海

  • 2025-04-28
    北京
  • 本文字数:980 字

    阅读完需:约 3 分钟

大小:530.55K时长:03:01
vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


vivo AI 研究院高性能计算工程师章苏迟已确认出席 AICon 上海并将在大模型架构创新与端侧智能落地实践专题发表题为《vivo 蓝心大模型端侧轻量化部署的创新路径》的主题分享。业内 AI 大模型正在飞速发展,近年来,行业内不断涌现各种十亿,百亿,千亿级别的大模型,在各个领域均展现了强大的能力。而智能手机作为拥有最大用户数量的终端设备,正成为大模型实现个性化场景与服务的核心载体。然而想在移动端有限的硬件资源上部署参数量庞大的大模型,其性能,内存,功耗均面临着严峻的挑战。


本次演讲将从 vivo 已上线的业务场景出发,深度剖析大模型落端过程中的核心瓶颈问题及其对应的解决方案,包含模型参数规模选择,性能 / 内存 / 功耗技术指标的优化等多个方面。


章苏迟于 vivo AI 研究院任职,主要从事 AI 高性能计算方向,负责 NN 网络在移动端的部署与性能优化,在 CPU、GPU、DSP 指令集优化和 AI 推理框架设计上有丰富经验,是 vivo 端计算解决方案 VCAP 的主力开发之一。当前正在负责 AI 大模型在移动端的部署与优化,解决大模型落端的性能和功耗问题,打造行业领先的端侧大模型能力。他在本次会议的详细演讲内容如下:


演讲提纲:

1. AI 业务端侧化相关背景

2. vivo 大模型端侧化业务场景介绍

3. 大模型端侧化瓶颈问题与解决方案

  • 大模型端侧化核心瓶颈指标

  • 端侧大模型参数规模选择

  • 端侧大模型性能/内存/功耗优化方案

  • 针对不同任务类型的业务场景如何定制优化策略

4. 未来展望


听众收益:

  • 大模型落端过程中有哪些技术难点,如何克服

  • 了解 vivo 在支撑业务场景良好体验的一些思考


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-28 18:008399

评论

发布
暂无评论
发现更多内容

2020年末总结,脚踏实地,一步一个脚印——致敬自己一年的心酸历程

孙叫兽

孙叫兽 年度报告 引航计划

话题讨论 |互联网软件技术培训,靠谱吗?

不脱发的程序猿

程序员 程序人生 话题讨论 互联网培训 技术培训

大作业1-同城快递业务系统设计

arcyao

话题讨论 | 云原生应用应该是什么样子?面临的技术挑战有哪些?

xcbeyond

微服务 云原生 Service Mesh 话题讨论

简金秋:区块链技术构建服装行业全新商业模式

CECBC

区块链 服装行业

重磅发布 | 2021年OpenAtom XuperChain开源技术路径

开放原子开源基金会

区块链 百度 开源 开放原子开源基金会

产品 0 期 - 第四周作业

vipyinzhiwei

“五年饮冰,难凉热血”,一名专科生的求学历程

不脱发的程序猿

程序人生 心路历程 2月春节不断更 大学总结 2020年度总结

让人“眼前一亮、不明觉厉”的互联网技术PPT

不脱发的程序猿

程序人生 PPT 2月春节不断更 互联网技术PPT 互联网工具

期末大作业一

心在那片海

Python实现钉钉/企业微信自动打卡

sum56

Python python 爬虫 打卡

用python提前预测jvm cpu100%自动dump thread

程序员石磊

JVM Thread cpu 100%

婚恋交友软件开发

luluhulian

Elasticsearch multi-index 搜索

escray

elastic 七日更 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

大作业2-知识总结

arcyao

使用APICloud敏捷式开发总结,回顾开发一个完整APP过程。

孙叫兽

App 开发 APICloud 引航计划

阿里架构师经验分享!写给互联网大厂员工的真心话,最全的BAT大厂面试题整理

欢喜学安卓

android 程序员 面试 移动开发

从崩溃的选课系统,论为什么更安全的 HTTPS 协议没有被全面采用

飞天小牛肉

Java 程序员 面试 计算机网络 2月春节不断更

股票配资系统开发

v16629866266

如何制作和使用自签名证书

soulteary

Docker SSL证书

复盘银行的区块链实践:从分布式账本,到产业数字化

CECBC

大数据 银行

全球区块链与数字经济领军课程

CECBC

数字经济 科技

百度网盘限速解决方案

孙叫兽

解决方案 百度网盘 限速

驱动力读书笔记之四

张老蔫

28天写作

从零开始学Android!15个经典面试问题及回答思路,这原因我服了

欢喜学安卓

android 程序员 面试 移动开发

OpenCV简介及其工程应用-游戏色块检测

行者AI

OpenCV

1. 这才是 Python 学习的正确起手姿势,滚雪球学 Python

梦想橡皮擦

Python python 爬虫 2月春节不断更 python入门 python学习

程序员养家活口接私活必备网站(顺便用技术改变世界)

孙叫兽

程序员 网站 私活

史上最全的技术手册整理总结,编程小白都从这篇文章迅速成为大牛

孙叫兽

Java 大前端 技术手册 开发文档

期末大作业二

心在那片海

即使技术再精,面试时一问这个必挂!!

冰河

面试 类加载器 我要进大厂 Java类加载

vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海_架构_AICon 全球人工智能开发与应用大会_InfoQ精选文章