写点什么

在先进工艺背景受限下,华为继续以“超节点”解答算力可持续性挑战

  • 2025-09-18
    北京
  • 本文字数:2194 字

    阅读完需:约 7 分钟

大小:1.03M时长:05:58
在先进工艺背景受限下,华为继续以“超节点”解答算力可持续性挑战

9 月 18 日,在华为全联接大会 2025 上,华为轮值董事长徐直军系统阐述了华为在 AI 基础设施上的整体布局:从昇腾芯片路线图,到新一代超节点与百万卡集群,再到自研互联协议“灵衢”的开放。


相比过往单点产品的发布,此次演讲的重点更在于 “以超节点为核心的算力架构范式”。徐直军直言:“算力,过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。”并再次强调:“基于中国可获得的芯片制造工艺,华为努力打造‘超节点+集群’算力解决方案,来满足持续增长的算力需求。”


在谈及未来算力架构之前,他先回顾了过去一年 AI 产业的重大变化。他提到:“DeepSeek 横空出世,让全国人民过了一个快乐的 AI 年,也让所有大模型训练者开启了不知多少个不眠之夜。”这场冲击也让昇腾产品和生态面临更多的反馈与期待。


为回应这些外部挑战与客户关切,华为在今年 8 月的昇腾产业峰会上提出了四点明确决定:

  • 华为坚持昇腾硬件变现;

  • CANN 编译器和虚拟指令集接口开放,其它软件全开源,CANN 基于 Ascend 910B/C 的开源开放将于 2025 年 12 月 31 日前完成,未来开源开放与产品上市同步;

  • Mind 系列应用使能套件及工具链全面开源,并于 2025 年 12 月 31 日前完成;

  • openPangu 基础大模型全面开源。


在此基础上,徐直军公布了昇腾芯片未来三年的演进路标。从即将推出的 Ascend 950 系列开始,分为两款:Ascend 950PR 面向推理 Prefill 和推荐业务,采用低成本 HBM(HiBL 1.0);Ascend 950DT 面向训练和推理 Decode,采用 HiZQ 2.0,单卡内存容量 144GB,内存带宽 4TB/s,互联带宽 2TB/s。2026 年一季度将首先推出 Ascend 950PR,950DT 则计划在 2026 年四季度上市。


之后在 2027 年四季度推出的 Ascend 960 将在算力、内存容量和互联带宽上全面翻倍,并支持自研 HiF4 精度格式。2028 年计划中的 Ascend 970 则预计在各项指标上再次大幅升级,FP4/FP8 算力和互联带宽全面翻倍,内存访问带宽至少增加 1.5 倍。徐直军表示:“总体上,我们将以几乎一年一代算力翻倍的速度,同时围绕更易用、更多数据格式、更高带宽等方向持续演进。”


基于这些芯片,华为认为“超节点”已经成为核心产品形态。所谓超节点,是物理上由多机组成,但逻辑上表现为一台计算机。Atlas 950 SuperPoD 支持 8192 张 Ascend 950DT,FP8 算力达到 8E FLOPS,FP4 算力 16E FLOPS,互联带宽 16PB/s。相比 Atlas 900 超节点,其训练性能提升 17 倍,达到 4.91M TPS;推理性能提升 26.5 倍,达到 19.6M TPS。Atlas 960 SuperPoD 则扩展至 15488 张 Ascend 960,FP8 算力 30E FLOPS,FP4 算力 60E FLOPS,互联带宽 34PB/s,训练和推理性能相较 Atlas 950 分别提升 3 倍和 4 倍以上。


徐直军强调,Atlas 950 至少“在未来多年都将保持是全球最强算力的超节点”,并将其与英伟达 NVL144 和 NVL576 对比,认为在卡规模、内存容量和带宽上均处于领先。


在集群层面,华为进一步扩展超节点。Atlas 950 SuperCluster 由 64 个 Atlas 950 超节点互联,规模超过 52 万张卡,FP8 算力达到 524 EFLOPS,计划在 2026 年四季度上市Atlas 960 SuperCluster 则将在 2027 年四季度推出,规模扩展至百万卡,FP8 算力 2 ZFLOPS,FP4 算力 4 ZFLOPS。两者均支持 UBoE(UB over Ethernet)与 RoCE 组网方案,其中华为推荐 UBoE 以获得更低时延和更高可靠性。徐直军表示,这些集群能够支撑“从千亿参数模型到十万亿参数模型的训练”。


华为也尝试将超节点概念引入到通用计算。基于 Kunpeng 950 的 TaiShan 950 SuperPoD,最大支持 16 节点、32 颗处理器,总内存容量 48TB,同时支持内存、SSD 和 DPU 池化。结合分布式 GaussDB 多写架构,可在无需改造的情况下实现性能提升,并平滑替代大型机和 Exadata 系统。徐直军直言:“TaiShan 950 加上分布式 GaussDB,将成为各类大型机、小型机的终结者。”这款产品预计将在 2026 年一季度上市。


在定义和设计 Atlas 950、Atlas 960 两个超节点的技术规格时,华为曾遭遇互联技术上的重大挑战。徐直军提到,主要有两个方面:其一是如何做到长距离同时保证高可靠性——现有电互联距离有限,而光互联虽能跨柜但可靠性不足。为此,华为在物理层到传输层引入高可靠机制,并在光路中加入百纳秒级故障检测与保护切换,同时重新设计光器件、光模块和互联芯片,使光互联的可靠性提升百倍,距离可超过 200 米。其二是如何实现大带宽并保持低时延——现有跨柜互联的带宽和时延与设计需求存在差距。华为通过多端口聚合、高密封装与统一协议,实现了 TB 级带宽和 2.1 微秒的时延。徐直军强调:“当时延已经低至 2~3 微秒时,哪怕 0.1 微秒的提升,都需要突破物理极限。


正是基于这些系统性创新,华为最终提出了面向超节点的新型互联协议“灵衢”。该协议具备总线级互联、平等协同、全量池化、协议归一、大规模组网和高可用性等特征。基于灵衢 1.0 的 Atlas 900 超节点自 2025 年 3 月交付以来,已累计部署超过 300 套。此次发布的 Atlas 950/960 则基于灵衢 2.0,华为宣布将开放该协议规范,邀请产业伙伴共建生态。


徐直军表示:“通过该互联协议,把数万规模的计算卡联接成一个超节点,能够像一台计算机一样工作、学习、思考、推理。”


整体而言,华为以“超节点”为核心的布局,指向的是在先进工艺受限背景下的一种算力可持续性探索。未来的检验点在于:灵衢协议在跨厂商生态中的兼容性,超节点在百万卡规模下的能效与稳定性,以及软件栈(CANN、MindSpore、GaussDB)的成熟度。对于中国 AI 产业而言,华为的方案既是技术突围的路径,也是产业协同的探索。

2025-09-18 16:36183

评论

发布
暂无评论
发现更多内容

华秋DFM荣获第三届智能制造创新大赛全国总决赛-新技术应用赛道三等奖

华秋电子

新一代“垫图”神器,IP-Adapter的完整应用解读

京东科技技术说

人工智能

【案例】多渠道管理 第七在线智能计划帮助Calvin Klein业务精准决策

第七在线

数字化商品计划已经Out啦 揭秘哪些国际⼤牌⽤了AI智能商品计划?

第七在线

火眼金睛破局ES伪慢查询 | 京东物流技术团队

京东科技开发者

数据库 慢查询 Elastic Search

第七在线引领零售供应链智能化,助力企业实现效能提升

第七在线

LED透明屏:私人定制引领新潮潮流

Dylan

广告 时尚产业 LED显示屏 全彩LED显示屏 led显示屏厂家

数智化重新定义员工体验

用友BIP

数智人力

每日一题:LeetCode-113. 路径总和 II

Geek_4z9ami

面试 算法 LeetCode 二叉树 DFS

探秘AI赋能的未来世界:CyberAI深度学习技术助力变革

数新网络官方账号

人工智能 大数据

HTML5+Canvas数字孪生智慧机房可视化系统

2D3D前端可视化开发

物联网 数字孪生 三维可视化 智慧机房 智慧数据中心

使用 PAI-Blade 加速 StableDiffusion Fine-Tuning

阿里云大数据AI技术

AI

如何在编写代码时添加有效的注释?

小魏写代码

2024年企业堡垒机采购要考虑因素详解

行云管家

网络安全 堡垒机 企业堡垒机

DFM引领电子产业变革,智能制造助力高效生产

华秋电子

如何发布自定义 npm 组件包

数新网络官方账号

前端 npm

新一代 “垫图” 神器,IP-Adapter 的完整应用解读

京东科技开发者

华秋荣获亿邦动力2023产业互联网千峰奖,引领电子产业数字化变革

华秋电子

数智时代,业财融合如何助力企业数智化转型?

用友BIP

业财融合

用友BIP数智干部管理,落实国有企业人才强企战略

用友BIP

干部管理

软件测试/人工智能|一文教你配置selenium环境

霍格沃兹测试开发学社

Spring Cloud Netflix移除后,我们又该何去何从?

木风mind

云原生 spring cloud alibaba java‘ spring cloud

基于Raft算法的DLedger-Library分析 | 京东物流技术团队

京东科技开发者

算法 分布式系统 raft DLedger

大模型那么火,教你一键Modelarts玩转开源LlaMA(羊驼)大模型

华为云开发者联盟

人工智能 华为云 华为云ModelArts 大模型 华为云开发者联盟

企业API网关适用业务场景

谷云科技RestCloud

API 网关

DAPP代币燃烧质押系统开发丨详情开发

l8l259l3365

喜讯!云起无垠入选“2023年中国AIGC创新企业榜”

云起无垠

避坑指南之财务共享中心建设项目团队搭建

用友BIP

财务共享

「智造」第15期:十问用友TimensionDB时序数据库

用友BIP

时序数据库

【腾讯云 HAI域探秘】体验大模型的多种业务应用

Hanson

活动预告| 字节跳动基于DataLeap的DataOps最佳实践

字节跳动数据平台

大数据 数据治理 数据安全 数据研发 企业号12月PK榜

在先进工艺背景受限下,华为继续以“超节点”解答算力可持续性挑战_华为_罗燕珊_InfoQ精选文章