2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

在先进工艺受限背景下,华为继续以“超节点”解答算力可持续性挑战

  • 2025-09-18
    北京
  • 本文字数:2194 字

    阅读完需:约 7 分钟

大小:1.03M时长:05:58
在先进工艺受限背景下,华为继续以“超节点”解答算力可持续性挑战

9 月 18 日,在华为全联接大会 2025 上,华为轮值董事长徐直军系统阐述了华为在 AI 基础设施上的整体布局:从昇腾芯片路线图,到新一代超节点与百万卡集群,再到自研互联协议“灵衢”的开放。


相比过往单点产品的发布,此次演讲的重点更在于 “以超节点为核心的算力架构范式”。徐直军直言:“算力,过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。”并再次强调:“基于中国可获得的芯片制造工艺,华为努力打造‘超节点+集群’算力解决方案,来满足持续增长的算力需求。”


在谈及未来算力架构之前,他先回顾了过去一年 AI 产业的重大变化。他提到:“DeepSeek 横空出世,让全国人民过了一个快乐的 AI 年,也让所有大模型训练者开启了不知多少个不眠之夜。”这场冲击也让昇腾产品和生态面临更多的反馈与期待。


为回应这些外部挑战与客户关切,华为在今年 8 月的昇腾产业峰会上提出了四点明确决定:

  • 华为坚持昇腾硬件变现;

  • CANN 编译器和虚拟指令集接口开放,其它软件全开源,CANN 基于 Ascend 910B/C 的开源开放将于 2025 年 12 月 31 日前完成,未来开源开放与产品上市同步;

  • Mind 系列应用使能套件及工具链全面开源,并于 2025 年 12 月 31 日前完成;

  • openPangu 基础大模型全面开源。


在此基础上,徐直军公布了昇腾芯片未来三年的演进路标。从即将推出的 Ascend 950 系列开始,分为两款:Ascend 950PR 面向推理 Prefill 和推荐业务,采用低成本 HBM(HiBL 1.0);Ascend 950DT 面向训练和推理 Decode,采用 HiZQ 2.0,单卡内存容量 144GB,内存带宽 4TB/s,互联带宽 2TB/s。2026 年一季度将首先推出 Ascend 950PR,950DT 则计划在 2026 年四季度上市。


之后在 2027 年四季度推出的 Ascend 960 将在算力、内存容量和互联带宽上全面翻倍,并支持自研 HiF4 精度格式。2028 年计划中的 Ascend 970 则预计在各项指标上再次大幅升级,FP4/FP8 算力和互联带宽全面翻倍,内存访问带宽至少增加 1.5 倍。徐直军表示:“总体上,我们将以几乎一年一代算力翻倍的速度,同时围绕更易用、更多数据格式、更高带宽等方向持续演进。”


基于这些芯片,华为认为“超节点”已经成为核心产品形态。所谓超节点,是物理上由多机组成,但逻辑上表现为一台计算机。Atlas 950 SuperPoD 支持 8192 张 Ascend 950DT,FP8 算力达到 8E FLOPS,FP4 算力 16E FLOPS,互联带宽 16PB/s。相比 Atlas 900 超节点,其训练性能提升 17 倍,达到 4.91M TPS;推理性能提升 26.5 倍,达到 19.6M TPS。Atlas 960 SuperPoD 则扩展至 15488 张 Ascend 960,FP8 算力 30E FLOPS,FP4 算力 60E FLOPS,互联带宽 34PB/s,训练和推理性能相较 Atlas 950 分别提升 3 倍和 4 倍以上。


徐直军强调,Atlas 950 至少“在未来多年都将保持是全球最强算力的超节点”,并将其与英伟达 NVL144 和 NVL576 对比,认为在卡规模、内存容量和带宽上均处于领先。


在集群层面,华为进一步扩展超节点。Atlas 950 SuperCluster 由 64 个 Atlas 950 超节点互联,规模超过 52 万张卡,FP8 算力达到 524 EFLOPS,计划在 2026 年四季度上市Atlas 960 SuperCluster 则将在 2027 年四季度推出,规模扩展至百万卡,FP8 算力 2 ZFLOPS,FP4 算力 4 ZFLOPS。两者均支持 UBoE(UB over Ethernet)与 RoCE 组网方案,其中华为推荐 UBoE 以获得更低时延和更高可靠性。徐直军表示,这些集群能够支撑“从千亿参数模型到十万亿参数模型的训练”。


华为也尝试将超节点概念引入到通用计算。基于 Kunpeng 950 的 TaiShan 950 SuperPoD,最大支持 16 节点、32 颗处理器,总内存容量 48TB,同时支持内存、SSD 和 DPU 池化。结合分布式 GaussDB 多写架构,可在无需改造的情况下实现性能提升,并平滑替代大型机和 Exadata 系统。徐直军直言:“TaiShan 950 加上分布式 GaussDB,将成为各类大型机、小型机的终结者。”这款产品预计将在 2026 年一季度上市。


在定义和设计 Atlas 950、Atlas 960 两个超节点的技术规格时,华为曾遭遇互联技术上的重大挑战。徐直军提到,主要有两个方面:其一是如何做到长距离同时保证高可靠性——现有电互联距离有限,而光互联虽能跨柜但可靠性不足。为此,华为在物理层到传输层引入高可靠机制,并在光路中加入百纳秒级故障检测与保护切换,同时重新设计光器件、光模块和互联芯片,使光互联的可靠性提升百倍,距离可超过 200 米。其二是如何实现大带宽并保持低时延——现有跨柜互联的带宽和时延与设计需求存在差距。华为通过多端口聚合、高密封装与统一协议,实现了 TB 级带宽和 2.1 微秒的时延。徐直军强调:“当时延已经低至 2~3 微秒时,哪怕 0.1 微秒的提升,都需要突破物理极限。


正是基于这些系统性创新,华为最终提出了面向超节点的新型互联协议“灵衢”。该协议具备总线级互联、平等协同、全量池化、协议归一、大规模组网和高可用性等特征。基于灵衢 1.0 的 Atlas 900 超节点自 2025 年 3 月交付以来,已累计部署超过 300 套。此次发布的 Atlas 950/960 则基于灵衢 2.0,华为宣布将开放该协议规范,邀请产业伙伴共建生态。


徐直军表示:“通过该互联协议,把数万规模的计算卡联接成一个超节点,能够像一台计算机一样工作、学习、思考、推理。”


整体而言,华为以“超节点”为核心的布局,指向的是在先进工艺受限背景下的一种算力可持续性探索。未来的检验点在于:灵衢协议在跨厂商生态中的兼容性,超节点在百万卡规模下的能效与稳定性,以及软件栈(CANN、MindSpore、GaussDB)的成熟度。对于中国 AI 产业而言,华为的方案既是技术突围的路径,也是产业协同的探索。

2025-09-18 16:369360

评论

发布
暂无评论
发现更多内容

LED透明屏幕引领传媒新趋势

Dylan

技术 品牌 LED显示屏 led显示屏厂家 市场

快手开源 I2V-Adapter,即插即用、轻量级模块让静态图像秒变动态视频

快手技术

SPL-404:如何彻底改变Solana上的NFT与DeFi

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

一文为你深度解析LLaMA2模型架构

华为云开发者联盟

人工智能 华为云 transformers 华为云开发者联盟 企业号2024年7月PK榜

鸿蒙应用实践:利用扣子API开发起床文案生成器

幂简集成

AI API

mac鼠标键盘共享:ShareMouse for Mac 激活版

你的猪会飞吗

Mac软件下载站

硬核解读,WeTune是如何提升数据库查询重写性能?

华为云开发者联盟

数据库 华为云 华为云GaussDB 华为云开发者联盟 企业号2024年7月PK榜

如何有效提升 API 接口的安全性?

左诗右码

后端

分享一次海量数据平滑迁移实战

京东零售技术

大数据 企业号2024年7月PK榜

智源十大行业高质量数据集开放申请,经验证可显著提升模型行业能力!

智源研究院

AI 驱动的数据中心变革与前景

GPU算力

从裁员到入职18k+,收获4个Offer,道阻且长不怯步

测试人

软件测试

半个月6次面试,终于进百度HR面了

王中阳Go

Go 百度 面试 面经

Disruptor在撮合引擎的实践|得物技术

得物技术

Java Disruptor 高性能 技术分享 企业号2024年7月PK榜

现代女性心理健康:数业智能心大陆解读应对策略

心大陆多智能体

人工智能 智能体 AI大模型 心理健康 数字心理

福利来了!MoneyPrinterPlus可以自动配置环境和自动运行了

程序那些事

工具 程序那些事 AIGC MoneyPrinterPlus

天工一刻 | 一文看懂小模型与端侧模型

新消费日报

测试人生 | 手工转测试开发成功秘籍揭秘:从裁员到入职18k+,收获4个Offer,道阻且长不怯步

测吧(北京)科技有限公司

测试

堡垒机试用选哪家?可以试用多久?咨询电话多少?

行云管家

网络安全 堡垒机 堡垒机试用

原厂商是什么意思?云管平台原厂商有哪些企业?

行云管家

云计算 云管平台 原厂商

Llama-2 vs. Llama-3:利用微型基准测试(井字游戏)评估大模型

Baihai IDP

程序员 AI LLMs 大模型评估 企业号 7 月 PK 榜

油猴Safari浏览器插件:Tampermonkey for Mac 下载

你的猪会飞吗

mac软件下载 浏览器脚本插件

一图看懂华为云CodeArts API 7大特性,带你玩转一站式API

华为云开发者联盟

软件开发 API 华为云 华为云开发者联盟 企业号2024年7月PK榜

字节跳动基于TrafficRoute DNS的超千亿级调度解析优化实践

火山引擎边缘云

DNS Tr IP 路由

基于心大陆AI大语言模型的多智能体应用

心大陆多智能体

人工智能 智能体 AI大模型 心理健康 数字心理

一览 Anoma 上的有趣应用概念

TechubNews

在先进工艺受限背景下,华为继续以“超节点”解答算力可持续性挑战_华为_罗燕珊_InfoQ精选文章