AICon 深圳站聚焦 Agent 技术、应用与生态,大咖分享实战干货 了解详情
写点什么

vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海

  • 2025-04-28
    北京
  • 本文字数:980 字

    阅读完需:约 3 分钟

大小:530.55K时长:03:01
vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


vivo AI 研究院高性能计算工程师章苏迟已确认出席 AICon 上海并将在大模型架构创新与端侧智能落地实践专题发表题为《vivo 蓝心大模型端侧轻量化部署的创新路径》的主题分享。业内 AI 大模型正在飞速发展,近年来,行业内不断涌现各种十亿,百亿,千亿级别的大模型,在各个领域均展现了强大的能力。而智能手机作为拥有最大用户数量的终端设备,正成为大模型实现个性化场景与服务的核心载体。然而想在移动端有限的硬件资源上部署参数量庞大的大模型,其性能,内存,功耗均面临着严峻的挑战。


本次演讲将从 vivo 已上线的业务场景出发,深度剖析大模型落端过程中的核心瓶颈问题及其对应的解决方案,包含模型参数规模选择,性能 / 内存 / 功耗技术指标的优化等多个方面。


章苏迟于 vivo AI 研究院任职,主要从事 AI 高性能计算方向,负责 NN 网络在移动端的部署与性能优化,在 CPU、GPU、DSP 指令集优化和 AI 推理框架设计上有丰富经验,是 vivo 端计算解决方案 VCAP 的主力开发之一。当前正在负责 AI 大模型在移动端的部署与优化,解决大模型落端的性能和功耗问题,打造行业领先的端侧大模型能力。他在本次会议的详细演讲内容如下:


演讲提纲:

1. AI 业务端侧化相关背景

2. vivo 大模型端侧化业务场景介绍

3. 大模型端侧化瓶颈问题与解决方案

  • 大模型端侧化核心瓶颈指标

  • 端侧大模型参数规模选择

  • 端侧大模型性能/内存/功耗优化方案

  • 针对不同任务类型的业务场景如何定制优化策略

4. 未来展望


听众收益:

  • 大模型落端过程中有哪些技术难点,如何克服

  • 了解 vivo 在支撑业务场景良好体验的一些思考


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-28 18:008564

评论

发布
暂无评论
发现更多内容

您有一份阿里云云原生直播攻略待查收

阿里巴巴云原生

阿里云 Kubernetes 云原生 线下活动

圆梦腾讯之路!6面阿里、5面字节、4面腾讯,终斩腾讯Offer

热爱java的分享家

Java 架构 面试 编程语言 经验分享

三顾茅庐,七面阿里,25k*16offer,还原我的大厂面经

热爱java的分享家

Java 程序人生 编程语言 经验分享 大厂面试

模块四课后作业 - 设计千万级学生管理系统的考试试卷存储方案

渐行渐远

架构实战营

黄峥、张一鸣、李斌都曾上榜!100个未来独角兽:超越估值看见星辰大海

创业邦

用AI走出“沙丘”

脑极体

[Pulsar] 一个消息的生命历程(二)——Batch和消息重复处理

Zike Yang

Apache Pulsar 11月日更

JavsScript基础篇之函数定义的几种不同方式

你好bk

JavaScript 大前端 数组 html/css

NodeJs深入浅出之旅:理解Buffer 🐰

空城机

大前端 Node 11月日更

智能时代的轴承与齿轮:工业互联网如何真正“工业化”?

脑极体

涨薪50%,从小厂逆袭,坐上美团L8技术专家(面经+心得)

热爱java的分享家

Java 面试 程序人生 编程语言 经验分享

声网Agora 实时音视频服务正式上线 HTC VIVE Sync App,支持非 VR 用户

声网

人工智能 音视频 vr

Prometheus Exporter (七)ClickHouse Exporter

耳东@Erdong

Prometheus exporter 11月日更 ClickHouse Exporter

Python Qt GUI设计:QLineEdit和QTextEdit文本框类(基础篇—13)

不脱发的程序猿

PyQt GUI设计 Python Qt QLineEdit QTextEdit

啥是ElasticSearch全流程,看这篇我也懂了

热爱java的分享家

Java 程序人生 编程语言 经验分享 ES

首个沉浸式云原生 Serverless 技术实践营开启报名

阿里巴巴云原生

阿里云 Serverless 云原生 KubeMeet 线下活动

官方:陆续清退比特币“矿场”

CECBC

区块链如何赋能农村金融服务?

CECBC

22 K8S之ConfigMap配置

穿过生命散发芬芳

k8s 11月日更

【死磕Java并发】-----J.U.C之AQS:CLH同步队列

chenssy

11月日更 死磕 Java 死磕 Java 并发

使用 Resilience4j 框架实现重试机制

码语者

Java 重试机制 Reslience4j

在Vue项目里使用ECharts图标库

石云升

Vue 学习笔记 11月日更 Echar

如何使用FL Studio效果器制作镶边音效

懒得勤快

函数计算 GB 镜像秒级启动:下一代软硬件架构协同优化揭秘

阿里巴巴云原生

阿里云 云原生 函数计算

linux之realpath命令

入门小站

Linux

干掉 XML Mapper,新出的 Fluent Mybatis 真香

AI乔治

Java sql 架构 mybatis

互联网+质量基础设施服务平台,NQI一站式线上平台开发

电微13828808271

12.04 深圳站 | Serverless Developer Meetup 开放报名啦!

阿里巴巴云原生

阿里云 Serverless 云原生 深圳 线下活动

spring的默认事务传播是什么?

卢卡多多

Spring Framework 事务传播行为 11月日更

90后女博士谈反内卷,称科研不应攀比论文数,“唯论文论”何时休?

百度开发者中心

开发者 内卷化

能耗能源管控平台开发,能源管理云平台搭建

电微13828808271

vivo 蓝心大模型端侧轻量化部署的创新路径|AICon 上海_架构_AICon 全球人工智能开发与应用大会_InfoQ精选文章