写点什么

vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海

  • 2025-04-28
    北京
  • 本文字数:980 字

    阅读完需:约 3 分钟

大小:530.55K时长:03:01
vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


vivo AI 研究院高性能计算工程师章苏迟已确认出席 AICon 上海并将在大模型架构创新与端侧智能落地实践专题发表题为《vivo 蓝心大模型端侧轻量化部署的创新路径》的主题分享。业内 AI 大模型正在飞速发展,近年来,行业内不断涌现各种十亿,百亿,千亿级别的大模型,在各个领域均展现了强大的能力。而智能手机作为拥有最大用户数量的终端设备,正成为大模型实现个性化场景与服务的核心载体。然而想在移动端有限的硬件资源上部署参数量庞大的大模型,其性能,内存,功耗均面临着严峻的挑战。


本次演讲将从 vivo 已上线的业务场景出发,深度剖析大模型落端过程中的核心瓶颈问题及其对应的解决方案,包含模型参数规模选择,性能 / 内存 / 功耗技术指标的优化等多个方面。


章苏迟于 vivo AI 研究院任职,主要从事 AI 高性能计算方向,负责 NN 网络在移动端的部署与性能优化,在 CPU、GPU、DSP 指令集优化和 AI 推理框架设计上有丰富经验,是 vivo 端计算解决方案 VCAP 的主力开发之一。当前正在负责 AI 大模型在移动端的部署与优化,解决大模型落端的性能和功耗问题,打造行业领先的端侧大模型能力。他在本次会议的详细演讲内容如下:


演讲提纲:

1. AI 业务端侧化相关背景

2. vivo 大模型端侧化业务场景介绍

3. 大模型端侧化瓶颈问题与解决方案

  • 大模型端侧化核心瓶颈指标

  • 端侧大模型参数规模选择

  • 端侧大模型性能/内存/功耗优化方案

  • 针对不同任务类型的业务场景如何定制优化策略

4. 未来展望


听众收益:

  • 大模型落端过程中有哪些技术难点,如何克服

  • 了解 vivo 在支撑业务场景良好体验的一些思考


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-28 18:005854

评论

发布
暂无评论

低代码平台是伪需求?不好意思,你的同行已经靠它完成转型升级了!

J2PaaS低代码平台

低代码 低代码开发 低代码开发平台 低代码平台

7个连环问揭开java多线程背后的弯弯绕

华为云开发者联盟

Java 多线程 工作内存 主内存

普普通通的Route

Time-sun

flutter

青藤:一招制敌!微隔离,让勒索软件不再横行

青藤云安全

聚合架构第一讲:开篇啦

钰湚—付晓岩

企业架构 软件工程 数字化转型 软件架构 业务架构

焱融 YRCloudFile 连获两项重量级认证,展现强劲存储实力!

焱融科技

云计算 分布式 云原生 高性能 文件存储

漏洞检测方法如何选?详解源代码与二进制SCA检测原理

华为云开发者联盟

安全 漏洞 软件成分分析 源代码SCA检测 二进制SCA检测

架构训练营-模块一作业

zhongwy

架构实战营

选课排课软件原生开发选课排课小程序模式源码开发

风行无疆

【架构实战营】模块六

衣谷

架构实战营

拆分电商系统为微服务

Beyond Ryan

架构实战营:模块一作业

Geek_93ffb0

「架构实战营」

基于RPA的自动化优先,正在成为广大组织的主流管理思维

王吉伟频道

RPA 机器人流程自动化 业务流程管理 自动化优先 业务流程自动化

浪潮云跻身中国政务大数据管理平台市场领导者位置

云计算 云计算运维

TypeScript 之模板字面量类型

冴羽

JavaScript typescript 翻译 大前端

华为云数据库GaussDB(for Influx)揭秘第二期:解密GaussDB(for Influx)的数据压缩

华为云开发者联盟

数据库 时序数据库 GaussDB(for Influx) 时序数据 数据压缩

区块链等技术将为中欧跨境电商带来革新以及助力城市产业转型升级

CECBC

1-1聚合架构第二讲:企业架构的认知历程

钰湚—付晓岩

企业架构 软件工程 数字化转型 软件架构 业务架构

6.《重学JAVA》--数据类型

杨鹏Geek

Java 25 周年 28天写作 12月日更

基于云的技术架构设计实践 - 第3篇

hackstoic

签约计划第二季 业务安全

如何建成有效的前端效能度量体系

benyasin

大前端 研发效能 研发度量 研发提效

谈谈创业感想

wood

创业 28天写作

低代码实现探索(五)前端组件图形化脚本

零道云-混合式低代码平台

震惊!大势已来!!区块链的真正价值是什么?

CECBC

你看到什么是因为要你看到什么

mtfelix

28天写作

如何处理工作与生活之间的冲突?

石云升

28天写作 职场经验 12月日更

如何对Android 11进行网络状态监听

Changing Lin

12月日更

实用机器学习笔记六:数据清理

打工人!

机器学习 算法 学习笔记 12月日更 实用机器学习

安全第二话

张老蔫

28天写作

低代码实现探索(三)后台模型执行设计

零道云-混合式低代码平台

低代码实现探索(四)前端组件核心模型

零道云-混合式低代码平台

vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海_架构_AICon 全球人工智能开发与应用大会_InfoQ精选文章