写点什么

vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海

  • 2025-04-28
    北京
  • 本文字数:980 字

    阅读完需:约 3 分钟

大小:530.55K时长:03:01
vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


vivo AI 研究院高性能计算工程师章苏迟已确认出席 AICon 上海并将在大模型架构创新与端侧智能落地实践专题发表题为《vivo 蓝心大模型端侧轻量化部署的创新路径》的主题分享。业内 AI 大模型正在飞速发展,近年来,行业内不断涌现各种十亿,百亿,千亿级别的大模型,在各个领域均展现了强大的能力。而智能手机作为拥有最大用户数量的终端设备,正成为大模型实现个性化场景与服务的核心载体。然而想在移动端有限的硬件资源上部署参数量庞大的大模型,其性能,内存,功耗均面临着严峻的挑战。


本次演讲将从 vivo 已上线的业务场景出发,深度剖析大模型落端过程中的核心瓶颈问题及其对应的解决方案,包含模型参数规模选择,性能 / 内存 / 功耗技术指标的优化等多个方面。


章苏迟于 vivo AI 研究院任职,主要从事 AI 高性能计算方向,负责 NN 网络在移动端的部署与性能优化,在 CPU、GPU、DSP 指令集优化和 AI 推理框架设计上有丰富经验,是 vivo 端计算解决方案 VCAP 的主力开发之一。当前正在负责 AI 大模型在移动端的部署与优化,解决大模型落端的性能和功耗问题,打造行业领先的端侧大模型能力。他在本次会议的详细演讲内容如下:


演讲提纲:

1. AI 业务端侧化相关背景

2. vivo 大模型端侧化业务场景介绍

3. 大模型端侧化瓶颈问题与解决方案

  • 大模型端侧化核心瓶颈指标

  • 端侧大模型参数规模选择

  • 端侧大模型性能/内存/功耗优化方案

  • 针对不同任务类型的业务场景如何定制优化策略

4. 未来展望


听众收益:

  • 大模型落端过程中有哪些技术难点,如何克服

  • 了解 vivo 在支撑业务场景良好体验的一些思考


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-28 18:008758

评论

发布
暂无评论

完美解决Win10“无法登陆到你的账户”问题,无法登录账户的全方面解决方案!

风骨散人

win10 系统

Service Mesh是什么,为我们解决了什么问题?

xcbeyond

Service Mesh 服务网格 3月日更

2021最新分享快手/百度/蚂蚁/字节面经总结

比伯

Java 程序员 架构 面试 程序人生

『设计模式』以为是个王者,后来班主任来了!设计模式--二五仔的观察者模式

风骨散人

设计模式 观察者模式

OKR之一

张老蔫

28天写作

『设计模式』80年代的人们竟然领悟了设计模式-- 发布者/订阅者模式 (包括发布者/订阅者模式和观察者模式的区别)

风骨散人

Java 设计模式 发布订阅模式

MapReduce的运行机制详解

五分钟学大数据

大数据 mapreduce 3月日更

进阶面试皆宜!阿里强推Java程序员进阶笔记,差距不止一点点

Java架构之路

Java 程序员 架构 面试 编程语言

牛哇!看完阿里独家面试手册金三银四稳了,GitHub一天标星66K(Java岗)

Java架构之路

Java 程序员 架构 面试 编程语言

已拿到蚂蚁金服Offer!阿里内部二十三万字Java面试题总结

Java架构之路

Java 程序员 架构 面试 编程语言

adb工具的基本使用

行者AI

软件测试

【里程碑】Linkis 1.0.0-RC1 版本发布

WeDataSphere

大数据 开源 WeDataSphere Linkis 计算中间件

iOS面试进阶&程序员养成文件(附下载地址)

ios 程序员 面试 iOS逆向

vivo 应用商店中的断点续传技术剖析

vivo互联网技术

源中瑞智慧平安社区-为社区居民保驾护航

13530558032

第九周学习总结于心得

产品经理训练营

大多数人不知道的Java知识 - Java内省机制

陈皮的JavaLib

Java 内省 java反射

GitHub已爆火!2021金三银四Java面试突击手册,已助力多人拿到offer

Java 编程 程序员 架构 面试

MySQL 索引原理 图文讲解

陈皮的JavaLib

MySQL 数据库 索引

『计算机组成原理』 计算机系统概述(考研、面试必备)

风骨散人

Rust从0到1-基础概念-变量

rust 变量

智慧公安重点人员系统开发,情报研判管控平台的搭建

13828808769

区块链数字版权-重新定义版权保护

13530558032

区块链电子合同--助推智慧政务

13530558032

云端身份认证和访问管理

龙归科技

身份云 云安全

智慧公安重点人员系统开发,情报研判管控平台的搭建

13828808769

行业资讯

JDBC--批量插入

打工人!

Java MySQL JDBC MySQL性能优化

【Mysql实战】问题分析利器之binlog

程序员架构进阶

MySQL 数据库 Binlog 28天写作 3月日更

『Python爬虫』Python实现刷B站、爱奇艺等视频网站播放量(Python教学文章)

风骨散人

Python 爬虫

区块链BaaS应用平台的搭建,BaaS平台的应用场景

13828808769

#区块链#

百度Feed稳定性架构实践

百度Geek说

解决方案 IDC feed

vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海_架构_AICon 全球人工智能开发与应用大会_InfoQ精选文章