AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海

  • 2025-04-28
    北京
  • 本文字数:980 字

    阅读完需:约 3 分钟

大小:530.55K时长:03:01
vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


vivo AI 研究院高性能计算工程师章苏迟已确认出席 AICon 上海并将在大模型架构创新与端侧智能落地实践专题发表题为《vivo 蓝心大模型端侧轻量化部署的创新路径》的主题分享。业内 AI 大模型正在飞速发展,近年来,行业内不断涌现各种十亿,百亿,千亿级别的大模型,在各个领域均展现了强大的能力。而智能手机作为拥有最大用户数量的终端设备,正成为大模型实现个性化场景与服务的核心载体。然而想在移动端有限的硬件资源上部署参数量庞大的大模型,其性能,内存,功耗均面临着严峻的挑战。


本次演讲将从 vivo 已上线的业务场景出发,深度剖析大模型落端过程中的核心瓶颈问题及其对应的解决方案,包含模型参数规模选择,性能 / 内存 / 功耗技术指标的优化等多个方面。


章苏迟于 vivo AI 研究院任职,主要从事 AI 高性能计算方向,负责 NN 网络在移动端的部署与性能优化,在 CPU、GPU、DSP 指令集优化和 AI 推理框架设计上有丰富经验,是 vivo 端计算解决方案 VCAP 的主力开发之一。当前正在负责 AI 大模型在移动端的部署与优化,解决大模型落端的性能和功耗问题,打造行业领先的端侧大模型能力。他在本次会议的详细演讲内容如下:


演讲提纲:

1. AI 业务端侧化相关背景

2. vivo 大模型端侧化业务场景介绍

3. 大模型端侧化瓶颈问题与解决方案

  • 大模型端侧化核心瓶颈指标

  • 端侧大模型参数规模选择

  • 端侧大模型性能/内存/功耗优化方案

  • 针对不同任务类型的业务场景如何定制优化策略

4. 未来展望


听众收益:

  • 大模型落端过程中有哪些技术难点,如何克服

  • 了解 vivo 在支撑业务场景良好体验的一些思考


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-28 18:001

评论

发布
暂无评论

零基础学习前端开发培训机构怎么选

小谷哥

那些你不知道的炫酷开关交互效果(12种)

南城FE

CSS 前端 交互设计

迎接工业互联网的龙卷风暴,软通动力绘制了一张转型地图

脑极体

重磅 | 招商局集团、招商局港口荣获CGMA年度大奖——九科信息与百年招商局共同探索财务数智化转型之路

九科Ninetech

大数据有没有必要参加培训?

小谷哥

零基础去程序员培训机构靠不靠谱?

小谷哥

瓴羊Quick BI 权限管理:开拓数据分析效率和智能化水平的新高度

对不起该用户已成仙‖

体验百度Java后端一面凉经,让我有了新的感悟

小小怪下士

Java 百度 程序员 面试

行业方案 | 新规落地,企业集团财务公司如何构建数智财务体系?

袋鼠云数栈

一名曾因线上P0故障导致月工资扣了10%的码农心得:如何在故障10分钟黄金时间快速排障

KINDLING

Java 运维 可观测性 线上故障 ebpf

可视化:数据可视化的作用

Data 探险实验室

数据分析 可视化 数据可视化 数据大屏

武汉前端培训学习靠不靠谱?

小谷哥

PCB工程师最实用的拼版案例合集请查收!

华秋PCB

PCB PCB设计 拼版

StoneDB荣获"2022年度优秀开源技术团队" : 决心做好下一代MySQL高性能分析加速器

StoneDB

MySQL 开源 HTAP 数据库· StoneDB

研发 Leader 怎样写出非研发也看得懂的年终总结?

思码逸研发效能

研发效能 年终总结

云计算技术是基于互联网和网络的新技术

Finovy Cloud

云服务器 云技术 云渲染

Zebec正在以流支付的方式,推动加密支付走向主流

股市老人

QSDK/ipq5018/2T2R/Bluetooth BT5.1 supporting QCN9074/industrial wifi6 module

wallysSK

QCN9074 ipq5018

Java: 在Excel中插入和提取图片

Geek_249eec

Java Excel 图片

创新研发负载分担机制,天翼云IPv6网络带宽再升级!

天翼云开发者社区

负载均衡 网络 ipv6

LeaRun.net代码生成器 一键生成前后端代码

力软低代码开发平台

ERP系统是什么?能起到什么作用?

优秀

ERP系统

任务管理轻松实现大规模设备管理控制——设备管理类

阿里云AIoT

运维 监控 云安全 消息中间件 储存

数据治理:聊聊数据血缘!

用友BIP

柏睿数据完成阿里云PolarDB数据库产品生态集成认证

阿里云数据库开源

阿里云 polarDB PolarDB-X PolarDB-PG PolarDB for PostgreSQL

学习web前端应该选择哪个培训机构?

小谷哥

无代码是否能成为主流

间隔

公司项目终于用上了插入式注解,真香!

Java永远的神

程序员 程序人生 项目 架构师 后端开发

我人傻了!新入职的同事三下五除二就搭建了一个简易版秒杀系统

程序员小毕

程序员 程序人生 后端 架构师 秒杀系统

AI作画技术实践第二期|用腾讯云智能图片融合优化AI绘画的效果

牵着蜗牛去散步

腾讯云 腾讯 AI作画 腾讯云智能 智能内容创作

vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海_架构_AICon 全球人工智能开发与应用大会_InfoQ精选文章