写点什么

百度 AI 网络的架构创新与优化之路 | QCon 北京

  • 2025-03-20
    北京
  • 本文字数:849 字

    阅读完需:约 3 分钟

百度 AI 网络的架构创新与优化之路 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


百度网络架构师李虎已确认出席并发表题为《百度 AI 网络的架构创新与优化之路》的主题分享,深入介绍百度 AI 网络架构的设计与实现,重点探讨在 AI 训练和推理过程中团队遇到的痛点问题及其创新解决方案,以及跨 AZ(可用区)RDMA 场景下的技术挑战与优化策略。另外将结合 DeepSeek 等前沿 AI 技术的发展,探讨其对 AI 网络架构带来的新需求与挑战,以期为未来 AI 网络的高效部署与扩展提供思路。


李虎拥有 10 多年网络研发架构设计经验,目前在百度负责网络架构工作,主导 AI 网络架构设计与升级,致力于为百度 AI 训练推理提供更高效更稳定的基础设施。他在本次会议的详细演讲内容如下:


演讲提纲

1. 百度 AI 网络的发展历程

  • 网络架构介绍,以及为何选择这类网络架构

  • 百度自研交换机赋能百舸 AI 网络

2. AI 网络中痛点问题及解决方案

  • 如何高效解决网络拥塞问题

  • 如何高效定位网络故障

  • AI 网络故障的全新解决思路

3. 跨 AZ RDMA 探讨

  • 实验室测试数据分享和后续规划

4. 基于 DeepSeek 批量部署后,AI 网络遇到的新挑战

  • MOE alltoall、PD 分离等场景下对网络带来的新挑战以及优化手段


您认为,这样的技术在实践过程中有哪些痛点?

  • 没有一套网络架构或者参数是适用于所有模型的,我们需要在实践中输出最合适本公司的解决方案


演讲亮点

  • 业内先进的拥塞控制解决方案

  • 为了提升 AI 网络稳定性,百度的实践经验


听众收益

  • 基于网络侧的优化,提升超大规模 AI 网络的训练、推理性能


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-20 09:403071

评论

发布
暂无评论
发现更多内容

大模型在商业领域的应用:如何提升决策效率与用户体验

测吧(北京)科技有限公司

测试

除了deadline,我们还能用什么驱动开发?

思码逸研发效能

程序员 DevOps 软件开发 编码 IT 运维

25个Linux系统性能调优技巧

威哥爱编程

Linux 系统调优

橱窗LED透明屏:展示和广告的新宠

Dylan

广告 制造 LED display LED显示屏 市场

火山引擎边缘智能×扣子,拓展AI Agent物理边界

火山引擎边缘云

揭秘京东商品详情一键获取的API之旅

代码忍者

pinduoduo API API 性能测试

同风起,耀星河!华为携手伙伴一起创造无限可能

HarmonyOS开发者

HarmonyOS

AIGC技术的变革:语音识别与视觉识别的深度融合

测吧(北京)科技有限公司

测试

测试流程必须严格执行吗?

老张

软件测试 验收测试 质量保障 流程规范

罗格科技:全球税务服务领域初露锋芒 罗格罗拉国际税大模型发布

科技热闻

1688电商生态新引擎:商品详情API引领行业发展新篇章

代码忍者

pinduoduo API API 性能测试

社区周刊·Vol.182

华为云开发者联盟

开发者 华为云

MQTT vs HTTP:谁更适合物联网?

EMQ映云科技

物联网 HTTP mqtt emqx

OCR+PDF解析配套前端工具开源详解!

合合技术团队

#开源 #前端 ODR

得物一面,都是非常经典的问题

王中阳Go

Go 面试 后端

堡垒机价格贵吗?一定要买堡垒机吗?

行云管家

网络安全 堡垒机 数据泄露

解锁极致性能:Arm Cortex-X925 IPC 提升15%,终端用户体验感再突破

新消费日报

文生图与文生视频:从文本到视觉的创作革命

测吧(北京)科技有限公司

测试

智能合约与大语言模型的结合:未来的应用场景探索

测吧(北京)科技有限公司

测试

深度学习在视觉识别中的突破:从理论到实践

测吧(北京)科技有限公司

测试

社交软件红包技术解密(二):解密微信摇一摇红包从0到1的技术演进

JackJiang

即时通讯;IM;网络编程

大数据存储计算平台EasyMR:多集群统一管理助力企业高效运维

袋鼠云数栈

用豆包MarsCode 和CozeAPI接口全自动做一个文生图组件

TRAE

人工智能 大数据 AI Chat

国际开发者成为 Apache IoTDB Committer,新视角谈开源经验!

Apache IoTDB

数据库 开源 时序数据库 IoTDB Apache IoTDB

智算基石全栈加速,百度百舸 4.0 的技术探索和创新

百度Geek说

百度 大模型 技术 优化体系

开源大模型的私有部署:Llama与千问的比较研究

测吧(北京)科技有限公司

测试

检索增强生成(RAG)技术在知识图谱中的应用:Neo4j的探索

测吧(北京)科技有限公司

测试

零信任身份安全的基本原则

芯盾时代

身份安全 零信任模型

Kafka集群升级项目实施方案,打造高效数据处理平台

敏捷调度TASKCTL

kafka hadoop cloudera 集群 大数据运维

国内外大模型应用的现状与未来:以ChatGPT、Mixtral和Llama为例

测吧(北京)科技有限公司

测试

智能体Agent应用的前沿:图文、短视频与流程图的生成技术

测吧(北京)科技有限公司

测试

百度 AI 网络的架构创新与优化之路 | QCon北京_百度_QCon全球软件开发大会_InfoQ精选文章