50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

千卡级分布式集群上的视觉多模态大模型落地实践 |AICon 上海

  • 2025-04-22
    北京
  • 本文字数:1113 字

    阅读完需:约 4 分钟

大小:605.33K时长:03:26
千卡级分布式集群上的视觉多模态大模型落地实践 |AICon上海

5 月 23 日-24 日,AICon全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


vivo AI 研究院 AI 架构师王兆雄已确认出席 AICon 上海并将在多模态大模型创新实践专题发表题为《千卡级分布式集群上的视觉多模态大模型落地实践》的主题分享。多模态大模型在智能客服、自动驾驶、AIGC 等领域的应用需求不断增长,但其训练工程面临计算、存储、数据处理、分布式通信等多重挑战。特别是在千卡级 GPU 训练集群上,如何优化数据加载、提升训练稳定性、突破计算与存储瓶颈,成为 AI Infra 需要重点攻克的难题。


本次演讲将基于 LLaVA 视觉多模态理解模型和 FLUX 文生图模型的训练工程实践,详细解析大规模 GPU 训练集群下的数据存储优化、分布式计算策略、训练容错机制,并探讨如何提升大规模多模态模型的训练效率和稳定性。演讲将重点介绍混合并行训练、数据高效加载、自动容错恢复等技术方案,为业界提供可落地的工程实践经验。


王兆雄曾就职于京东商城和猎豹移动,拥有丰富的大数据分析和游戏服务端研发经验,主导设计并实现了支撑数千万日活用户的轻量级游戏服务端架构。目前在 vivo AI 研究院任职,负责过 vivo 手机智慧桌面信息流和全局搜索服务端的推荐与搜索架构,支撑亿级用户。现负责视觉多模态大模型的训练工程,具备千卡级分布式集群上大模型训练的丰富经验,致力于构建高性能、可扩展的 AI 解决方案。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 多模态大模型的训练工程挑战

2. AI Infra 四大优化方向

  • 数据处理优化

  • 模型计算优化

  • 分布式通信优化

  • 训练稳定性建设

3. 训练工程案例:LLaVA & FLUX

  • 视觉多模态理解模型(LLaVA)的训练优化

  • 文生图 FLUX 结构的训练工程

4. AI Infra 未来展望


听众收益:

  • 深入理解多模态大模型的训练挑战,尤其是理解模型 vs 生成模型的工程区别

  • 掌握大规模 GPU 训练集群的优化策略,包括数据处理、并行计算、通信优化

  • 学习如何提升训练稳定性,减少长时间训练中的失败率

  • 借鉴 LLaVA 和 FLUX 训练的实际优化经验,为自身多模态模型训练提供参考


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-22 14:005402

评论

发布
暂无评论

CANN5.0黑科技解密 | 别眨眼!缩小隧道,让你的AI模型“身轻如燕”!

华为云开发者联盟

AI CANN 昇腾 模型压缩 模型缩小隧道

这都是什么

冇先生

MatrixDB 4.3 发布:持续聚集等6大特性解读!

YMatrix 超融合数据库

数据库 时序数据库 分布式时序数据库

netty系列之:搭建客户端使用http1.1的方式连接http2服务器

程序那些事

Java Netty 程序那些事 http2 11月日更

算法的本质是什么?程序员如何学好算法?

Sakura

Java 架构 面试 算法

架构实战营 毕业总结

一雄

架构实战营 毕业总结

毕业总结

面向对象的猫

毕业总结

拥抱时序数据库,构筑IoT时代下智慧康养数据存储底座

华为云开发者联盟

数据 IoT 时序数据库 华为云 智慧康养

财经大课:运用现代经济学分析中国经济的关键常识

石云升

学习笔记 财经思维 11月日更

数字化转型浪潮滚滚 区块链造就可信“数字经济底座”

CECBC

linux之我常用的20条命令(之二)

入门小站

Linux

CSS架构之Acss层(中)

Augus

CSS 11月日更

IDEA免费激活至2099年教程,亲测可用

Tom弹架构

Java 工具 IDEA

制度密码经济学:了解区块链的经济影响

CECBC

架构实战训练营 - 毕业结语

NewBranSTONE

「架构实战营」

如何在 Spring 中使用事件

码语者

Spring Boot Event 事件

毕业设计项目 电商秒杀系统

面向对象的猫

架构实战营 - 模块七作业

en

#架构实战营

【设计模式】第九篇 - 适配器模式 - 你多大鞋,我多大脚

Brave

设计模式 适配器模式 11月日更

老板再也不用担心我不会K8s了,哪里不会点哪里,15个开放学习K8s的网址

奔着腾讯去

运维 云原生 Docker Desktop k8s资源 Go 语言

《重学Java高并发》手写生产者消费者模型

中间件兴趣圈

高并发 java; 11月日更

架构训练营毕业总结

老实人Honey

软件工程师的专业素养解读

卢卡多多

11月日更

2021全屋智能为何依然进展缓慢?

脑极体

重新认识 nginx 反向代理

liuzhen007

11月日更

架构实战营模块毕业总结

老猎人

架构实战营

架构实战营毕业总结

xyu

架构实战营

用得上的 JavaScript 代码片段和技巧

devpoint

JavaScript LocalStorage reduce 11月日更

双十一来袭,阿里技术官终于把高并发系统设计整理成册了(全彩版开源)

Sakura

Java 架构 面试 后端 高并发

10种黑客类型,你知道几种?

喀拉峻

黑客思维 黑客 网络安全 信息安全

防抖&节流

达摩

js 防抖 节流

千卡级分布式集群上的视觉多模态大模型落地实践 |AICon上海_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章