早在 20 世纪 90 年代初,数学家们就已经证明,随机连接路由器可以形成最高效、最具弹性的网络拓扑结构。亚马逊云科技耗时约 30 年,才将这一研究成果转化为实际的生产基础设施。该公司透露,基于准随机图理论的扁平化网络架构弹性网络图( RNG ),现在已经成为全球大多数新建非 GPU AWS 数据中心的默认架构。
在一篇发表于 arXiv 的论文中,Giacomo Bernardi(亚马逊云科技首席应用科学家)、Ratul Mahajan(华盛顿大学,亚马逊学者)和 Seshadhri Comandur(加州大学圣克鲁兹分校,亚马逊学者)将其描述为基于扩展器的网络架构的首次大规模生产部署。具体数据如下:网络设备数量减少 69%,吞吐量最高提升 33%,预计网络设备能耗将降低 40%。
要理解这一点为何重要,不妨先看看它取代了什么。传统的数据中心网络采用胖树拓扑结构:服务器连接到架顶交换机(ToR),架顶交换机连接到汇聚交换机,汇聚交换机再连接到主干交换机。不同机架上的两台服务器之间的流量必须沿着层级结构向上传输到共享的主干交换机,然后再向下传输回来。如果这些主干链路发生拥塞,即使其他地方带宽充足,吞吐量也会下降。增加容量意味着要增加整层交换机,这不仅成本高昂,而且耗电量巨大。

图片来源:Amazon 科学博客
正如 Reddit 上一位从业者所言,关键的洞见在于,RNG 本质上是“一种物理拓扑挑战,而非明确的路由挑战”:
其核心在于拥有足够能路由流量的节点,然后通过被动式光纤 ShuffleBox 对这些节点的连接关系进行准随机化处理。这样一来,平均而言既能减少热点链路,又能降低对昂贵的高带宽聚合链路的需求。
就具体的网络架构而言,正如另一位评论者所解释的那样,亚马逊云科技实际上完全替换了原有的脊叶(Spine-Leaf)层级架构,改为“所有架顶交换机通过机架间上行链路模块,直接与任意其他架顶交换机互连的网格结构”。原有的层级结构彻底消失了,每个机架都直接连接到一组准随机的其他机架。”
要实现这一目标,需要解决两个问题。第一个是物理布线问题。在超大规模数据中心中,你不可能随意在机房内铺设电线。亚马逊云科技开发了 ShuffleBox,这是一种内部光纤布线经过随机化处理的无源光器件。它使逻辑拓扑呈现出准随机性,同时让物理布线变得像插入本地端口一样简单。由于 ShuffleBox 是无源设备,所以不会增加延迟、不消耗电力,也不会引入新的故障模式。
第二个问题是路由。由于缺少层级结构来引导数据包,所以流量需要采取不同的策略。亚马逊云科技开发了 Spraypoint,这是一种定制的分布式协议,能将流量同时分发到相邻的路由器上,并利用指定的中转点将数据包引导至目的地。将数据包分发到多条路由上听起来似乎很浪费,但正如一位 Reddit 评论者所指出的那样:
将同一个数据包通过多条路径进行分发听起来效率不高,乍一看似乎根本无法提升速度……但仔细想想,如果你的网络中已经内置了无需牺牲性能的多路径冗余机制,何不直接利用这部分带宽来传输数据包副本,而不是让它闲置不用呢?
在评估网络架构时,弹性特性或许是从业者最具说服力的论据。在胖树拓扑中,一旦失去一个主干交换机,其下方的每个机架都会因此产生灾难性的瓶颈。而在随机图拓扑中,即使损失 1% 的路由器,带宽损失也仅约为 1% 。网络性能的下降是按比例的,而非灾难性的,因为随机图将连通性分布得极为均匀,没有任何单个节点会成为瓶颈。
在正式部署前,亚马逊云科技的团队进行了全面的验证,在 EC2 上针对数十种流量模式运行了相当于 530 处理器年的模拟。首个生产网络于 2024 年底在爱尔兰都柏林附近上线。在 2026 年 4 月将 RNG 设为默认方案之前,亚马逊云科技已经在爱尔兰、德国和西班牙的设施中完成了三次部署,用于验证和优化方案。arXiv 论文指出,与胖树设计相比,该方案在保持同等或更优性能的同时,实现了 9% 至 45% 的成本节约。客户无需对工作负载做任何调整。
一个重要的适用范围限制:RNG 针对的是通用计算场景,其中的流量模式接近随机分布。而 AI 训练会产生协调一致、集中化的流量,这不符合该模型。因此,在 GPU 集群中,亚马逊云科技继续使用 UltraServer 架构。
业界的疑问是,这究竟会成为亚马逊云科技独有的优势,还是会演变为其他运营商采纳的架构。谷歌、微软和 Meta 均已发布关于替代 Fat-Tree 结构的研究,但截至目前,尚未有哪家公司公开披露自己部署了同等规模的基于扩展器的网络。
原文链接:https://www.infoq.com/news/2026/06/aws-random-graph-data-center/





