10 月 23 - 25 日,QCon 上海站即将召开,现在大会已开始正式报名,可以享受 8 折优惠 了解详情
写点什么

百度 AI 网络的架构创新与优化之路 | QCon 北京

  • 2025-03-20
    北京
  • 本文字数:849 字

    阅读完需:约 3 分钟

百度 AI 网络的架构创新与优化之路 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


百度网络架构师李虎已确认出席并发表题为《百度 AI 网络的架构创新与优化之路》的主题分享,深入介绍百度 AI 网络架构的设计与实现,重点探讨在 AI 训练和推理过程中团队遇到的痛点问题及其创新解决方案,以及跨 AZ(可用区)RDMA 场景下的技术挑战与优化策略。另外将结合 DeepSeek 等前沿 AI 技术的发展,探讨其对 AI 网络架构带来的新需求与挑战,以期为未来 AI 网络的高效部署与扩展提供思路。


李虎拥有 10 多年网络研发架构设计经验,目前在百度负责网络架构工作,主导 AI 网络架构设计与升级,致力于为百度 AI 训练推理提供更高效更稳定的基础设施。他在本次会议的详细演讲内容如下:


演讲提纲

1. 百度 AI 网络的发展历程

  • 网络架构介绍,以及为何选择这类网络架构

  • 百度自研交换机赋能百舸 AI 网络

2. AI 网络中痛点问题及解决方案

  • 如何高效解决网络拥塞问题

  • 如何高效定位网络故障

  • AI 网络故障的全新解决思路

3. 跨 AZ RDMA 探讨

  • 实验室测试数据分享和后续规划

4. 基于 DeepSeek 批量部署后,AI 网络遇到的新挑战

  • MOE alltoall、PD 分离等场景下对网络带来的新挑战以及优化手段


您认为,这样的技术在实践过程中有哪些痛点?

  • 没有一套网络架构或者参数是适用于所有模型的,我们需要在实践中输出最合适本公司的解决方案


演讲亮点

  • 业内先进的拥塞控制解决方案

  • 为了提升 AI 网络稳定性,百度的实践经验


听众收益

  • 基于网络侧的优化,提升超大规模 AI 网络的训练、推理性能


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-20 09:403163

评论

发布
暂无评论

5.《重学JAVA》--编码规范

杨鹏Geek

Java 25 周年 28天写作 12月日更

IT 好文&好课分享

hackstoic

【AI最前线】精准优质-资讯|分享|热议第43期

百度大脑

人工智能

模块一作业

撿破爛ぃ

「架构实战营」

如何提升工作意义感?

石云升

28天写作 职场经验 12月日更

LongAdder解析

程序员历小冰

28天写作 并发’ 12月日更

保存并提交修改后的容器镜像

liuzhen007

28天写作 12月日更

如何“对抗”听众的短时记忆

将军-技术演讲力教练

【架构师训练营】模块一作业

樰巳-堕~Horry

架构实战营 「架构实战营」

浅谈指标体系建设(二)

圣迪

指标体系 指标

AI安全领域的“雨山机车大赛”,改变了什么?

脑极体

在 Ubuntu 上安装使用极狐GitLab Runner

极狐GitLab

CI/CD runner 极狐GitLab

List 去重的 6 种方法,这个方法最完美!

王磊

声网 X 远程超声:实时音视频解决基层“看病难” 推动医疗资源均衡化

声网

人工智能 音视频

了解学习 JSX 的工作方式

devpoint

React JSX 12月日更

【LeetCode】字母异位词分组Java题解

Albert

算法 LeetCode 12月日更

《重学Java高并发》手写一个生产者消费者线程模型

中间件兴趣圈

Java高并发 生产者消费者模型

[Pulsar] F# client的ProtobufNativeSchema实现

Zike Yang

Apache Pulsar 12月日更

xxxx

guangbao

共享

mtfelix

28天写作

非专业的系统安全规范

张老蔫

28天写作

全员客户成功

boshi

随笔杂谈

大白话解析 MySQL 中的 MCCC 机制

悟空聊架构

MySQL MVCC 28天写作 悟空聊架构 12月日更

2021年度人工智能最佳产品TOP10!百度飞桨EasyDL再获业界认可

百度大脑

人工智能

web安全之CSRF

喀拉峻

网络安全

.NET 6新东西--nuget包验证

喵叔

28天写作 12月日更

模块一学习总结

Only

「架构实战营」

JavaScript中的这些内置对象

你好bk

JavaScript 大前端 数组 html/css 12月日更

36 K8S之角色控制访问

穿过生命散发芬芳

k8s 28天写作 12月日更

架构实训营

ren

自我改变的意义

卢卡多多

28天写作 技术改变生活 12月日更

百度 AI 网络的架构创新与优化之路 | QCon北京_百度_QCon全球软件开发大会_InfoQ精选文章