写点什么

百度 AI 网络的架构创新与优化之路 | QCon 北京

  • 2025-03-20
    北京
  • 本文字数:849 字

    阅读完需:约 3 分钟

百度 AI 网络的架构创新与优化之路 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


百度网络架构师李虎已确认出席并发表题为《百度 AI 网络的架构创新与优化之路》的主题分享,深入介绍百度 AI 网络架构的设计与实现,重点探讨在 AI 训练和推理过程中团队遇到的痛点问题及其创新解决方案,以及跨 AZ(可用区)RDMA 场景下的技术挑战与优化策略。另外将结合 DeepSeek 等前沿 AI 技术的发展,探讨其对 AI 网络架构带来的新需求与挑战,以期为未来 AI 网络的高效部署与扩展提供思路。


李虎拥有 10 多年网络研发架构设计经验,目前在百度负责网络架构工作,主导 AI 网络架构设计与升级,致力于为百度 AI 训练推理提供更高效更稳定的基础设施。他在本次会议的详细演讲内容如下:


演讲提纲

1. 百度 AI 网络的发展历程

  • 网络架构介绍,以及为何选择这类网络架构

  • 百度自研交换机赋能百舸 AI 网络

2. AI 网络中痛点问题及解决方案

  • 如何高效解决网络拥塞问题

  • 如何高效定位网络故障

  • AI 网络故障的全新解决思路

3. 跨 AZ RDMA 探讨

  • 实验室测试数据分享和后续规划

4. 基于 DeepSeek 批量部署后,AI 网络遇到的新挑战

  • MOE alltoall、PD 分离等场景下对网络带来的新挑战以及优化手段


您认为,这样的技术在实践过程中有哪些痛点?

  • 没有一套网络架构或者参数是适用于所有模型的,我们需要在实践中输出最合适本公司的解决方案


演讲亮点

  • 业内先进的拥塞控制解决方案

  • 为了提升 AI 网络稳定性,百度的实践经验


听众收益

  • 基于网络侧的优化,提升超大规模 AI 网络的训练、推理性能


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-20 09:403464

评论

发布
暂无评论

CodeArts Check代码检查服务用户声音反馈集锦(2)

云计算 软件开发 代码规范 华为云 代码检查

GaussDB(for Redis)游戏实践:玩家下线行为上报

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号9月PK榜

软件测试/测试开发丨​利用ChatGPT编写测试用例

测试人

软件测试 测试开发 ChatGPT

http代理ip服务器有哪些?代理服务器有什么作用?

巨量HTTP

代理IP http代理

推送服务本地通知频次及分类管控通知

HarmonyOS SDK

HMS Core

“融合康养产业、乐享宜居灞桥”灞桥康养论坛成功举办

联营汇聚

【ChatGPT-应用篇】基于chatGPT覆盖测试过程的初步探索 | 京东物流技术团队

京东科技开发者

人工智能 测试 ChatGPT 企业号9月PK榜

高并发系统设计之缓存

Java随想录

Java nginx 缓存

程序员会使用的十个基础算法

小魏写代码

小灯塔系列-中小企业数字化转型系列研究——进销存测评报告

人称T客

微调语言模型前,需要考虑这三个关键方面

Baihai IDP

AI LLM 白海科技 大模型微调 Baihai IDP

NFTScan Meetup 上海站主题分享:TON 的发展现状与未来展望

NFT Research

NFT\

中秋时节赏明月,五子棋戏月饼趣 — Flutter中秋限定版五子棋

编程的平行世界

flutter 游戏开发

高性能网络 SIG 月度动态:推动 virtio 支持动态中断调节及更灵活的分流机制

OpenAnolis小助手

Linux 内核 龙蜥社区 virtio 高性能网络sig

交易所开发 通过定制解决方案获得优势:加密货币交易服务

区块链软件开发推广运营

交易所开发 数字藏品开发 dapp开发 区块链开发 链游开发

灞桥康养论坛圆满落幕 灞桥康养“四片区”邀您遇见新西安

联营汇聚

Hologres RoaringBitmap实践:千亿级画像数据秒级分析

阿里云大数据AI技术

大数据 阿里云

万字长文教你实现华为云IoT+OpenHarmony智能家居开发

华为云开发者联盟

鸿蒙 物联网 华为云 华为云开发者联盟 企业号9月PK榜

文盘Rust -- tonic-Rust grpc初体验 | 京东云技术团队

京东科技开发者

rust gRPC 虚拟操作系统 企业号9月PK榜

分布式系统的主键生成方案对比 | 京东云技术团队

京东科技开发者

分布式系统 uuid 企业号9月PK榜 主键生成

怎么解决在数据采集时使用http代理ip效率不高的问题?

巨量HTTP

http代理

本地缓存无冕之王Caffeine Cache

Java随想录

Java 缓存

DApp智能合约链上盲盒游戏代币质押项目挖矿系统开发

l8l259l3365

Pyth

20个最佳实践提升Terraform工作流程|Part 1

SEAL安全

基础设施 IaC terrafrom 企业号9月PK榜

第五期 PaddlePaddle Hackathon 飞桨黑客马拉松热身赛上线!

飞桨PaddlePaddle

深度学习 编程、

iOS16新特性:实时活动-在锁屏界面实时更新APP消息 | 京东云技术团队

京东科技开发者

iOS16 企业号9月PK榜 Live Activity

百度 AI 网络的架构创新与优化之路 | QCon北京_百度_QCon全球软件开发大会_InfoQ精选文章