vivo 蓝心大模型端侧轻量化部署的创新路径｜AICon 上海_架构_AICon 全球人工智能开发与应用大会_InfoQ精选文章



大小：530.55K时长：03:01

vivo 蓝心大模型端侧轻量化部署的创新路径｜AICon 上海

5 月 23 日-24 日，AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地，围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题，呈现技术与应用融合的最新趋势。

vivo AI 研究院高性能计算工程师章苏迟已确认出席 AICon 上海并将在大模型架构创新与端侧智能落地实践专题发表题为《vivo 蓝心大模型端侧轻量化部署的创新路径》的主题分享。业内 AI 大模型正在飞速发展，近年来，行业内不断涌现各种十亿，百亿，千亿级别的大模型，在各个领域均展现了强大的能力。而智能手机作为拥有最大用户数量的终端设备，正成为大模型实现个性化场景与服务的核心载体。然而想在移动端有限的硬件资源上部署参数量庞大的大模型，其性能，内存，功耗均面临着严峻的挑战。

本次演讲将从 vivo 已上线的业务场景出发，深度剖析大模型落端过程中的核心瓶颈问题及其对应的解决方案，包含模型参数规模选择，性能 / 内存 / 功耗技术指标的优化等多个方面。

章苏迟于 vivo AI 研究院任职，主要从事 AI 高性能计算方向，负责 NN 网络在移动端的部署与性能优化，在 CPU、GPU、DSP 指令集优化和 AI 推理框架设计上有丰富经验，是 vivo 端计算解决方案 VCAP 的主力开发之一。当前正在负责 AI 大模型在移动端的部署与优化，解决大模型落端的性能和功耗问题，打造行业领先的端侧大模型能力。他在本次会议的详细演讲内容如下：

演讲提纲：
1. AI 业务端侧化相关背景
2. vivo 大模型端侧化业务场景介绍
3. 大模型端侧化瓶颈问题与解决方案
大模型端侧化核心瓶颈指标
端侧大模型参数规模选择
端侧大模型性能/内存/功耗优化方案
针对不同任务类型的业务场景如何定制优化策略
4. 未来展望

听众收益：
大模型落端过程中有哪些技术难点，如何克服
了解 vivo 在支撑业务场景良好体验的一些思考

除此之外，本次大会还策划了AI Agent 构建及多元应用、多模态大模型创新实践、AI for Data，数据管理与价值挖掘实践、大模型推理性能优化策略、AI 产品设计的创新思维、智能硬件与大模型的融合探索、金融领域大模型应用实践、大模型助力业务提效实践等专题，届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。

现在报名即可以享受 9 折优惠，单张门票立省 580 元，详情可扫码或联系票务经理 13269078023 咨询。

评论

发布

暂无评论

RAG+Agent人工智能平台：RAGflow实现GraphRA知识库问答，打造极致多模态问答与AI编排流体验

汀丶人工智能

智能问答 rag RAGflow

望繁信科技受邀出席ACS2023，为汽车行业数智化护航添翼

望繁信科技

数字化转型流程挖掘流程资产流程智能数字北极星

探索高质量大模型训练平台建设路径——大模型训练标准第三次研讨会顺利召开

中国信通院AI Infra工作组

云南大理等级保护测评机构在哪里？电话多少？

java线程池使用指南

巧手打字通

Java 性能优化线程池

TiDB 和 Flink 数据集成实战

TiDB 社区干货传送门

《2024网络安全十大创新方向》发布，云起无垠引领新风向

第二届Apache Flink极客挑战赛冠军比赛攻略_SkyPeaceLL队

阿里云天池

链游开发：TON链小游戏与其他链DApp小游戏开发指南

区块链软件开发推广运营

交易所开发 dapp开发链游开发 NFT开发公链开发

中国信通院边缘人工智能平台标准首轮评估正式启动

中国信通院AI Infra工作组

【Tomcat源码分析】从零开始理解 HTTP 请求处理 (第一篇)

tomcat源码解读

《科研智能（AI4R&D）——人工智能驱动的研发新范式》正式发布

中国信通院AI Infra工作组

行业革新，数据先行：智源研究院数据与行业应用 Workshop第三期

智源研究院

华为发布智算数据中心基础设施十大建设原则

Apache Doris 2.1.6 版本正式发布

数据仓库数据分析 LakeHouse 物化视图

云栖大会Day1：云应用开发平台 CAP 来了

阿里巴巴云原生

阿里云云原生云栖大会

在k8s上部署tidb数据库

TiDB 社区干货传送门

eggtart队比赛攻略

阿里云天池

“模”力十足！天翼云息壤一体化智算服务平台训推服务能力重磅升级！

天翼云开发者社区

云计算大模型天翼云

海尔连续3年蝉联生态品牌认证“领航者”，飞书获评“突破者” ，共建生态绿洲

ToB行业头条

万界星空科技电线电缆行业MES系统核心功能

万界星空科技

mes 万界星空科技电线电缆行业电线电缆mes

助力企业降低成本，ByteHouse打造新一代“弹性”云数仓

字节跳动数据平台

数据库大数据云原生 Clickhouse 数仓

中国人工智能产业发展联盟正式发布《科研智能（AI4R&D）——人工智能驱动的研发新范式》

中国信通院AI Infra工作组

大模型训练平台标准第三次研讨会即将召开

中国信通院AI Infra工作组

万界星空科技商业开源MES系统全面解析

万界星空科技

开源 mes 开源mes 万界星空科技 mes源码

华为全联接大会2024︱鲲鹏计算产业峰会成功举办

京东商品属性的详细api数据解析：颜色、尺寸与材质

技术冰糖葫芦

API Gateway API 接口 API 测试 pinduoduo API

参赛故事｜背水一战的机会，金蝶云苍穹助我圆保研梦

金蝶云·苍穹

开发者大赛金蝶金蝶云苍穹中国软件杯

Gradio离线部署到内网，资源加载失败问题（Gradio离线部署问题解决方法）

Zilliz Cloud 最新功能速览：迁移服务、Fivetran Connector、多副本 Replica

AI 向量数据库 zilliz cloud

AI助力低代码平台：从智能化到高效交付的全新变革

天津汇柏科技有限公司

低代码 AI 人工智能