亚马逊云科技已在所有支持 EC2 Capacity Blocks 的区域,将面向机器学习的该服务价格统一上调,涨幅约 15%。此次价格调整影响的是为大规模机器学习工作负载预留专用 GPU 计算能力的组织,亚马逊云科技旗下最强的多款 ML 实例价格均同步上涨,包括基于 NVIDIA GPU 的 P5en、P5e、P5 以及 P4d,以及使用 AWS Trainium 的 Trn2 和 Trn1 实例。
尽管亚马逊云科技自 2023 年推出 Capacity Blocks 以来一直强调其定价会根据供需关系动态调整,但云经济学家 Corey Quinn 在领英博文中指出,这次调整与常见的动态定价机制并不相同:
这是亚马逊云科技直接更新了官网公布的基础价格……每小时 34.608 美元统一变为 39.799 美元,所有区域一致。这是一次政策层面的决定,而不是供需波动。
EC2 Capacity Blocks for ML 允许企业在亚马逊 EC2 UltraClusters 中预留 GPU 实例。而 UltraClusters 则是亚马逊云科技为需要数百甚至上千张 GPU 的分布式机器学习训练而优化的高性能计算基础设施。与标准预留实例或 Savings Plans 不同,Capacity Blocks 能在明确的时间窗口内(通常从一天到数周)保证客户获得指定实例类型的使用权。
这一变化的影响并不止于成本上升本身。Platform Fix 创始人 Steve Wade 在 Quinn 的同一条领英博文的讨论区中指出了更深层的意义:
先例已经被立下了,这才是关键。一旦这扇门被打开,就不会再关上。每个 FinOps 团队的风险清单里,都会多出一项。
Portainer 的产品负责人 Nathan Peck 则从更宏观的经济背景解读了这一变化:
要警惕通胀和美元贬值的速度,这二者正在超过摩尔定律带来的效率提升。这才是真正改变云计算模式的临界点。无法跟上通胀的“静态价格”,在技术上等同于持续降价。一旦云厂商无法继续维持这种状态,提前自购硬件反而会显得更有吸引力。
此次调价也反映了云基础设施市场真实存在的供应链压力。富国银行董事总经理兼技术高管 David Lee 表示:
我们正在经历另一轮类似疫情时期的供应紧张,尤其是在内存和网络交换设备方面。几乎所有东西都在涨价。
不过,真正的瓶颈可能并非很多人想象的那样。一位资深 DevSecOps 工程师 James S. 指出:
这里的“供给”其实是电力。微软 CEO 曾提到,他们有整仓库的 GPU 尚未安装,因为根本没有地方部署。
可替代方案的稀缺进一步放大了这次涨价的实际影响。一位 Reddit 的 r/aws 社区用户评论道:
Capacity Blocks 基本上是你唯一能用到这些实例类型的方式。几乎不可能按需启动它们。某种程度上,这等于对外宣传一个按需价格,但实际收费却更高。
这种稀缺性意味着企业几乎没有空间去消化这次成本上涨。更重要的是,即便是签署了企业折扣协议的客户也无法幸免,因为这些折扣通常是按百分比计算,而不是固定金额——公开价格上涨 15%,实际成本同样会上涨 15%。
目前尚不清楚这是亚马逊云科技的单独调整,还是整个行业趋势的一部分。Snowflake 的战略解决方案工程师 Spencer T. 指出,此次涨价似乎主要集中在使用 NVIDIA H200 GPU 的 P5e 实例上,这可能意味着:“英伟达对云服务商提高了价格,这更像是上游成本向下游转嫁,而不是一个全新的定价先例”。
至于谷歌云平台或微软 Azure 是否会对其 GPU 产品进行类似调整,目前仍无明确消息,但业内普遍认为,这些底层成本压力同样影响着所有的超大规模云厂商。
对于机器学习团队和 FinOps 从业者而言,这次涨价再次凸显了工作负载优化和成本治理的重要性。首席云架构师 Ivo Pinto 总结道:
在当前 GPU 和内存价格背景下,这并不令人意外。真正重要的是,充分理解你正在使用的服务,以及它背后的定价机制。
目前,该价格调整已在所有支持 EC2 Capacity Blocks for ML 的亚马逊云科技区域正式生效。亚马逊云科技下一次计划中的定价评估时间为 2026 年 4 月。更详细的价格信息可在 AWS EC2 Capacity Blocks 官方定价页面中查看。
原文链接:
https://www.infoq.com/news/2026/01/ec2-ml-capacity-price-hike/





