50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

飞桨分布式技术揭秘:如何高效训练文心 4.5 大模型|QCon 上海

  • 2025-09-27
    北京
  • 本文字数:1139 字

    阅读完需:约 4 分钟

大小:632.43K时长:03:35
飞桨分布式技术揭秘:如何高效训练文心 4.5 大模型|QCon 上海

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


百度资深工程师陈锐彪已确认出席并发表题为飞桨分布式技术揭秘:如何高效训练文心 4.5 大模型的主题分享。本次演讲将重点分享飞桨在文心 4.5 系列大模型训练中的性能优化实践,涵盖多模异构 MoE 结构下的工程挑战与系统性解决方案,包括混合并行策略、负载均衡优化、显存效率提升及 FP8 训练等关键技术。


陈锐彪,百度资深工程师,飞桨(PaddlePaddle)深度学习框架研发,曾参与开发飞桨框架静态图执行引擎、自动并行等核心架构。目前主要工作方向为大模型分布式训练,深度参与百度文心系列模型的工程优化工作。他在本次会议的详细演讲内容如下:


演讲提纲

1. 多模异构 MoE 模型的工程挑战

  • 视觉模块对流水并行的影响

  • 变分数据对负载均衡的影响

  • 多模态联合训练对存算均衡的影响

2. 多模型结构混合并行

  • 视觉编码并行策略

  • MoE 并行策略

3. 分层多模负载均衡策略

  • 粗粒度数据重排

  • 变长序列并行模式

4. 极致存算均衡技术

  • 显存友好 MoE 架构

  • 显存优化流水编排

  • 细粒度重计算

  • FlashMask

  • 稀疏掩码技术

5. FP8 训练与优化

  • 算子融合

  • FP8 通信优化

  • FP8 显存优化

6. 大规模集群训练技术

  • 高效自动故障感知、定位、容错机制

7. 总结与展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 多模型结构混合并行策略的工程实现

  • 多模数据负载均衡


演讲亮点

  • 针对多模异构 MoE 模型的多模型结构混合并行策略实现,能最大化并行效率

  • 多模态负载均衡策略,降低多模变分数据对端到端性能的影响


听众收益

  • 了解飞桨大规模分布式技术及其在文心模型上的应用

  • 了解大模型训练的难点及其常见解决方案


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-27 10:001

评论

发布
暂无评论

国内主流商业智能BI工具剖析

流量猫猫头

大数据

【JUC】交换器Exchanger详解

JAVA旭阳

Java JUC

java培训怎么学习才好?

小谷哥

前端培训没有基础应该怎么学习

小谷哥

白嫖GitHub Pages,轻松搭建个人博客

LigaAI

Hexo GitHub Pages 个人博客 个人网站 12 月 PK 榜

App 长登录思考与实现part2

石君

App 信息安全 认证

火山引擎DataTester揭秘:字节如何用A/B测试,解决增长问题的?

字节跳动数据平台

大数据 AB testing实战 12 月 PK 榜

云原生应用的最小特权原则

HummerCloud

k8s rbac 云原生安全

奇点云DataSimba R4.5发布关键更新,做到“可大可小可观测”

奇点云

直播预告|PostgreSQL 技术内幕(四)执行引擎之Portal

酷克数据HashData

从React源码分析看useEffect

goClient1992

React

一线大厂为什么面试必问分布式?

钟奕礼

Java 程序员 java面试 java编程

星环科技数据中台解决方案,助力某政府机构建设新型智慧城市

星环科技

【11.25-12.02】写作社区优秀技术博文回顾

InfoQ写作社区官方

热门活动

技术内幕 | 阿里云EMR StarRocks 极速数据湖分析

StarRocks

#数据库

编译器优化丨Cache优化

华为云开发者联盟

后端 开发 华为云 12 月 PK 榜

前端培训学习程序员如何提高解决问题的能力

小谷哥

大数据培训程序员工作前景如何

小谷哥

云小课|基于华为云WAF的日志运维分析,构筑设备安全的城墙

华为云开发者联盟

后端 华为云 waf 12 月 PK 榜

刘德华在线演唱会,火山引擎边缘云助力打造极致视频直播体验

火山引擎边缘云

云原生 边缘计算 节点 火山引擎边缘计算

三翼鸟,用两年开启下一个十年

脑极体

大数据培训学习程序员还好找吗

小谷哥

TiDB在科捷物流神州金库核心系统的应用与实践

TiDB 社区干货传送门

迁移 实践案例 HTAP 场景实践 OLTP 场景实践

一张「有想法」的表单,玩出线上填表新花样

爱科技的水月

解读数仓中的数据对象及相关关系

华为云开发者联盟

数据库 后端 华为云 数据对象 12 月 PK 榜

手把手教你成为荣耀开发者:账户结算操作指南

荣耀开发者服务平台

android 开发者 手机 荣耀 honor

架构实战营模块1第1课 - 什么是架构,你理解对了么

净意

架构实战营

别再被小程序全页变灰给坑了

FE情报局

小程序 前端

龙蜥社区 11 月运营大事件回顾

OpenAnolis小助手

活动 生态 龙蜥社区 11月 运营月报

在一次又一次的失败中,我总结了这份万字的《MySQL性能调优笔记》

钟奕礼

Java 程序员 java面试 java编程

React 之元素与组件的区别

冴羽

JavaScript react.js 前端 前端框架 React

飞桨分布式技术揭秘:如何高效训练文心 4.5 大模型|QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章