最近,亚马逊云科技推出了 M9g 和 M9gd 实例,将每颗芯片的内核数量翻倍,增加到了 192 个,并将它们集成在了四颗基于台积电 3nm 工艺节点制造的芯片上。其规格如下:192 MB L3 缓存(是 Graviton4 的五倍)、DDR5-8800(目前所有云实例中最快的 DDR5 内存)、PCIe Gen 6,以及首个在生产级云环境中经过正式验证的虚拟机管理程序隔离技术。

亚马逊云科技将 Graviton5 明确定位于代理式 AI 工作负载。亚马逊官方博客将其描述为“专为满足代理式 AI、实时推理、代码生成和多步骤任务协调的需求而设计。在这些场景中,处理器必须处理大量的并发环境并确保加速器持续运行。”
并非所有人都认同这种定位。在 Reddit 上,r/hardware 社区在赞扬芯片本身的同时,也对这种 AI 定位提出了质疑。一位评论者直言不讳地表示:
它们就是普通的 ARM 内核,能够完成 CPU 通常承担的所有任务,例如运行 Web 服务器或数据库。之所以称其为 AI 内核,唯一的原因是市场部有人认为,加上 AI 这个词会更受欢迎。
还有人从从业者真正关心的方面论证其价值:
Graviton 从问世之初就是一款出色的 CPU。它不支持 SMT,每个 vCPU 都配备一个真正的内核,拥有海量的 L2 缓存,而且性价比极高。新一代产品则更胜一筹。
这种区分很重要。Graviton5 的确是一款出色的通用 ARM 处理器,并且恰巧非常适合代理工作负载,因为它们对 CPU 资源的需求很高。将其称为“AI 芯片”夸大了架构层面的变化。实际的变化主要是内核数量、缓存、内存带宽以及互连延迟。这些改进对数据库、Web 服务器和批处理的益处,与对代理工作负载的益处同样显著。
Meta 的投入是这一消息最重要的佐证。Meta 已签署合同为其代理式 AI 项目部署数千万个 Graviton5 内核,这使其成为 Graviton 全球最大的客户之一。Uber 和 Snowflake 也在为其代理式工作负载部署 Graviton5。
为期六个月预览期的客户基准测试数据清晰地展现了这款芯片的性能表现。与 M8g 相比,在未进行任何代码修改的情况下,ClickHouse 的性能提升了 36%。在针对生产环境可观测性工作负载进行的为期六个月的 A/B 测试中,相较于 Graviton4,Honeycomb 的每核吞吐量提升了 36%。HubSpot 在 MySQL 数据库中部署了 M9g,查询耗时最高缩短了 60%。Airbnb 首席性能工程师 Denis Sheahan 说,这是“我们迄今测试过的速度最快的 EC2 实例之一”。
Nitro 隔离引擎值得单独关注一下。该引擎内置于第六代 Nitro 系统中,通过形式验证为虚拟机之间提供经过数学证明的隔离,即通过数学证明而非仅靠测试来确立隔离边界的正确性。正如 The New Stack 所报道的那样,这使得 Graviton5 实例成为首个在生产环境中采用形式验证虚拟机管理程序隔离技术的主流公有云实例。对于运行多租户工作负载或评估在何处执行不可信代理代码的团队而言,这种经过形式验证的隔离边界所提供的安全保障,比当前任何竞争对手的云实例类型都要更强。
虽然定价信息已经公布,但是需要结合具体的情况来理解。DevelopersIO 对 us-east-1 区域按需计费的分析显示,M9g 实例的所有规格均比 M8g 实例贵 9%。结合 25% 的计算性能提升来看,这意味着每美元的性价比提高了约 15%。实际收益将因工作负载而异。M9gd 实例提供了高达 11.4 TB 的 NVMe SSD 存储空间,其 IOPS 比上一代高出 30%,主要面向多媒体处理、批处理任务以及需要本地高速临时存储空间的应用程序等工作负载。
该产品系列尚未完全定型。他们计划于 2026 年下半年推出计算优化的 C9g 变体和内存优化的 R9g 变体。对于面临最严苛推理或分析工作负载的团队,他们建议在决定迁移前先等待一下 C9g 的基准测试结果,因为 M9g 是一种通用型实例类型,可能无法体现 Graviton5 在专用配置下所能达到的性能上限。
谷歌为 GKE 提供了定制的 Axion 处理器,而微软则依赖基于 ARM 的 Cobalt 100。在定制芯片采用方面,亚马逊云科技进展最为迅速:过去三年中,Graviton 占所有新增 CPU 容量的半数以上,其定制芯片业务的年化营收已经突破 200 亿美元。
M9g 和 M9gd 实例现在已经提供了按需实例、节省计划、竞价实例、专用实例和专用主机套餐。此外,这些实例目前已经在美国东部(北弗吉尼亚、俄亥俄)、美国西部(俄勒冈)和欧盟(法兰克福)地区上线。





