
华尔街的分析师们还是有些“功底”的。在 2025 亚马逊云科技 re:Invent 开幕前,奥本海默重申对亚马逊的“跑赢大盘”评级,并强调亚马逊云科技藏有“黄金机会”;摩根大通判断亚马逊云科技的需求趋势依然健康,并预计 2026 年将迎来加速增长。
这些判断的一个重要背景就是,一年一度的“云计算春晚”又来了。当亚马逊云科技再次拿到行业叙事的“麦克”,云计算的演进主线被定义得更加具体——这一次,亚马逊云科技 CEO Matt Garman 在 Keynote 上的所有发布,几乎都是围绕 Agentic AI 的落地展开。纵观整个 2025 所有来自云计算巨头的发布会,如此坚决的聚焦与定调十分罕见。
Matt Garman 认为要落地 Agentic AI,并“实现完整 AI 能力”,需要四大关键支柱:AI Infra、模型生态、数据基座以及开发者工具。
围绕这四个方向,亚马逊云科技带来一系列重量级新品与功能增强。包括 Amazon Trainium3 UltraServers 和最新 AI 芯片 Amazon Trainium4,第二代自研大模型 Amazon Nova 2 系列,承载“开放训练模型”(Open Training)概念的数据基座 Amazon Nova Forge,以及在开发者工具层面 Amazon Bedrock AgentCore 的系列更新,All For Agentic AI。
实际上,亚马逊云科技自身就是 Agentic AI 的头部玩家——三个 Frontier Agent 作为重头戏被陆续发布,包括能自主处理复杂编码任务、深度集成开发流程的 Kiro Autonomous Agent,主动扫描漏洞、将渗透测试转为按需服务的 Amazon Security Agent,以及能够自动诊断并预防故障、先于工程师响应的 Amazon DevOps Agent。
不过即便是 Matt Garman,在准备演讲内容时也会“纠结”:两个半小时看似很长,但对这家云计算和 AI 巨头来说,还是太短了,毕竟,它们每年有太多新产品、新发布。所以这次,在 Agentic AI 成为主基调的 2025 亚马逊云科技 re:Invent 上,Matt Garman 将传统计算、存储、数据库这些核心云服务,压缩到了最后的十分钟快闪发布中,并一口气带来了 25 个更新。算下来,每项更新的发布时间只有 24 秒。
总的来说,这场 Keynote 依旧保持了 re:Invent 重头戏应有的水准,但对行业而言,当云计算一哥在一场持续 2 个多小时、总计 20246 个词汇的演讲中,提到了 199 次 Agent 时,其对 Agentic AI 的重视已不用更多言明。而在一年前,Agent 一词仅仅出现了 45 次。这也传递出一个重要信号:时代真的变了。
构建 Agent 必备的 AI Infra,仍在快速迭代
Agentic AI 落地首先要回答的问题就是,如何构建 AI Infra。在 2025 亚马逊云科技 re:Invent 开幕前,整个市场都在屏息以待其自研 AI 芯片 Amazon Trainium 的最新进展。其中的一大重要原因就是,Amazon Trainium 不仅是一颗芯片,也是亚马逊云科技构建 AI Infra 护城河最重要的“胜负手”。
亚马逊 CEO Andy Jassy 在上个月的财报电话会议上透露,Amazon Trainium 系列芯片目前已发展成为一个价值数十亿美元的核心业务,季度环比增长 150%。Matt Garman 在本次 Keynote 中亦强调,Amazon Trainium2 是亚马逊云科技迄今部署速度最快的 AI 芯片,销售速度几乎和产能齐平。
消息面上,10 月底,亚马逊云科技建造的 Project Rainier 核心数据中心已全面投入运行,这一超级集群配备近 50 万颗 Amazon Trainium2 芯片,目前正为 Anthropic 训练 Claude 大模型。到今年年底,该集群的 Amazon Trainium2 芯片数量预计翻番至 100 万颗。
可以说,以 Amazon Trainium 系列芯片为中心的算力底座,早已成为亚马逊云科技 AI 战略的核心。而围绕着 Amazon Trainium 系列芯片的迭代更新,也被早早写到了日历本中——去年,亚马逊云科技就宣布正在开发下一代芯片 Amazon Trainium3,目标是让 AI 负载更高效、更快速且更具成本优势。
在 2025 亚马逊云科技 re:Invent 上,亚马逊云科技宣布 Amazon Trainium3 UltraServers 正式全面可用。据悉,Amazon Trainium3 专为密集型和专家级并行工作负载而设计,支持高级数据类型(MXFP8 和 MXFP4),并优化了内存与计算资源的平衡,以应对实时、多模态和推理任务。每颗 Amazon Trainium3 芯片提供 2.52 千万亿次浮点运算(PFLOPs)的计算能力,内存容量比 Amazon Trainium2 提升 1.5 倍,带宽提升 1.7 倍,达到 144 GB HBM3e 内存和 4.9 TB/s 内存带宽。
与 Amazon Trainium2 相比,这款基于云端 3nm 芯片的服务器在性能上大幅提升:计算能力提升 4.4 倍,内存带宽提升 3.9 倍,每兆瓦功耗可处理的 AI tokens 数量提升 5 倍。
为了验证 Amazon Trainium3 UltraServers 的实际效果,亚马逊云科技在多种开源模型上进行了测试。以 OpenAI 开源的对话模型系列 GPT-OSS 为例,将已在 Amazon Trainium2 上优化过的模型权重迁移到 Amazon Trainium3,并进行推理测试后发现,其效率显著提升。
知道如何吊观众胃口的亚马逊云科技还专门预告了正在开发中的 Amazon Trainium4。与 Amazon Trainium3 相比,Amazon Trainium4 将在各个维度实现大幅跃升:FP4 计算性能提升 6 倍、内存带宽提升 4 倍、高带宽内存容量提升 2 倍,以支持大规模模型的训练需求。
Amazon Trainium 系列芯片之外,亚马逊云科技还推出了搭载英伟达最新 GB200 NVL72 系统的 P6e-GB300 实例。与 P5en 实例相比,这些 UltraServers 在英伟达 NVLink™ 下的计算能力超过 20 倍,内存带宽提升超过 11 倍,非常适合计算和内存密集型的 AI 工作负载。
难以想象的是,这两家云计算与 AI 领域的巨头已经合作了超过 15 年。Matt Garman 称,亚马逊云科技是第一家在云中提供英伟达 GPU 的厂商,其 GPU 集群稳定性已经经受多方验证。亚马逊云科技更倾向于将自己定位为“AI 基础设施”,这一定位基于的事实就是,亚马逊云科技具备丰富的大规模 AI Infra 项目经验。比如,英伟达自己的大规模 GenAI 集群 Project Ceiba 就运行在亚马逊云科技上;亚马逊云科技与 OpenAI 最新签署的 380 亿美元算力大单,目的也是协助 ChatGPT 生成回答或训练下一代模型。
这次,亚马逊云科技特别推出了 Amazon AI Factories,帮助企业在自己的数据中心内部署专属的亚马逊云科技 AI Infra。Amazon AI Factories 更像是 AI 专有云,企业能够用自己的数据中心空间与电力能力,访问亚马逊云科技服务。可这也说明,亚马逊云科技在严肃地看待公有云和私有化部署模式,给企业更多选择,让其 AI 落地更加友好。
可以说,这场 Keynote 传递出的第一个重要信号就是,构建 Agent 必备的 AI Infra,在计算集群和 IDC 层面,仍然在快速迭代。
Agent 落地元年,亚马逊云科技的叙事逻辑变了
至于第二个信号,就是亚马逊云科技一直在强调的 “Choice Matters”——亚马逊云科技继续强化 Amazon Bedrock 的模型丰富度,模型能力很重要,但并非重点,企业私有数据才是关键。这些,都决定了 Agentic AI 的落地效果。
本次,Amazon Bedrock 带来了 4 款自研模型更新,以及多款第三方模型,Kimi 和 MiniMax 作为首次入驻 Amazon Bedrock 的模型,也在 2025 亚马逊云科技 re:Invent 的舞台上获得了全世界的关注。模型层面上的丰富度,也是亚马逊云科技 Choice Matters 理念的延续——选择大于一切,优秀的模型将长期并存。
模型层面,相比去年 Andy Jassy 半小时的专门发布,今年简洁了许多。这次亮相的 Amazon Nova 2 系列模型包括 4 款:Lite、Pro、Sonic 和 Omni。
其中,Amazon Nova 2 Lite 主打快速且经济高效,能够处理文本、图像和视频,适用于日常工作负载。Amazon Nova 2 Lite 在 15 项基准测试中,有 13 项与 Claude Haiku 4.5 持平或更优;在 17 项基准测试中,有 11 项与 GPT-5 Mini 持平或更优;在 18 项基准测试中,有 14 项与 Gemini Flash 2.5 持平或更优。
Amazon Nova 2 Pro 主打智能推理,能够处理文本、图像、视频和语音,适用于高度复杂的工作负载,尤其是需要复杂指令理解和 Agent 工具调用的场景。据悉,Amazon Nova 2 Pro 在 16 项基准测试中,有 10 项与 Claude Sonnet 4.5 表现相当或更优;在 19 项基准测试中与 Gemini 2.5 Pro 表现相当或更优。此外,该模型也可以作为知识提炼的“教师”,将其能力迁移到更小、更高效的“学生”模型中,以适应特定的领域和用例。
Amazon Nova 2 Sonic 是下一代语音转语音模型,支持将文本和语音的理解与生成融为一体,可实现实时、类人对话式 AI。此外,Amazon Nova 2 Sonic 还拥有百万级的上下文窗口,支持持续交互,且能在语音和文本之间无缝切换。
压轴的 Amazon Nova 2 Omni 是首次推出的“新物种”,也是业界首个支持文本、图像、视频和音频输入,并支持文本和图像生成输出的推理模型。据介绍,Amazon Nova 2 Omni 能处理 75 万字的文本、数小时的音频、长视频和百页文档,并能同时分析整个产品目录、客户评价、品牌指南和视频库。而在此之前,完成这些工作往往需要多个模型协同。如今看来,亚马逊云科技在 re:Invent 2024 上提出的“卷王”概念“Any to Any”,真的实现了。
除了自研的 Nova 2 系列模型,Amazon Bedrock 又“上新”了多款顶尖模型,包括谷歌 Gemma、英伟达 Nemotron 等。目前在 Amazon Bedrock 中,中国模型占据四席:除了早就在 Amazon Bedrock 中的 Qwen、DeepSeek 系列模型,Kimi 和 MiniMax 也成功“上榜”。更多国内大模型的加入,传递出的一大信心就是,我国模型在推理能力、多模态能力等方面的确已经走到了国际前列,并步入大规模企业应用爆发期。
不过正如前文所言,模型能力并非这次 Keynote 的重点,企业私有数据才是关键。
Matt Garman 用了很长一部分时间,强调私有数据(Your Data)在 AI 中的关键作用——数据才是企业之间最关键,也最难以复制的差异。当模型能够深入理解一家企业的数据、流程和特点时,它能够实现的效果会呈指数级提升。而当模型进一步与企业专有数据和知识产权深度结合时,AI 的“魔力时刻”才真正会出现。这一切的前提就是,企业的数据必须能够在云端被安全地访问与使用。
目前,企业最常用、也最成功的方式,是通过 RAG(检索增强生成)或向量数据在推理时为模型提供上下文。这种方法确实能够提升模型在海量企业数据中导航和检索的能力,让返回结果更加精准。但这类方法也存在天花板,因为几乎所有的企业都有一个更深层的诉求:希望模型不仅能“读懂”数据,还能真正“理解”数据。所以问题又回到了企业需要“训练一个自己的模型”。
训练模型上,一般有两种选择:要么从零开始训练一个私有模型,要么基于一个开源权重模型进行再训练。前者不仅成本极高,企业往往也缺乏训练前沿模型所需的规模化数据、算力和专业能力;后者虽然能通过微调、强化学习等方式,使模型更贴合具体业务场景,但存在能力上限,并且随着定制的深化,模型反而容易“遗忘”原本的基础能力,例如核心推理能力。
亚马逊云科技给出了预训练和微调以外的第三条路——Amazon Nova Forge。Amazon Nova Forge 首次引入“开放训练模型”(Open Training)理念,通过向企业开放 Amazon Nova 预训练、中期训练和后期训练阶段的模型检查点,以便企业可以在训练各阶段将自有数据与 Amazon Nova 精选数据集进行混合,从而打造既结合了 Amazon Nova 完整知识与推理能力,又深刻理解企业业务语境的定制模型。
亚马逊云科技将这些定制模型称为“Novellas”,目前,企业可以基于 Amazon Nova 2 Lite 开始构建自有 Novellas,并可将其部署在 Amazon Bedrock 上,享受与其他 Amazon Bedrock 模型一致的企业级安全性、可扩展性和数据隐私保护。
最重要的,依旧是开发者
开发者的重要性,在这场 Keynote 开场时就已经凸显。在 DJ KARA 的气氛烘托下,Matt Garman 一登场就给到开发者们情绪价值:未来属于开发者。
在开发者工具层面,Amazon Bedrock AgentCore 带来了多项更新。一大变化在于,这次亚马逊云科技不止讨论 AI 能做什么,更强调 AI 不能做什么,尤其是确定性的约束。这也解答了 Agentic AI 时代大家关心的一大问题:我们该如何在 Agent 的开放能力与可控边界之间找到平衡?
这一次,亚马逊云科技带来了两个解法。为了约束 Agent,让其不越界,Amazon AgentCore 推出了 Policy(策略)功能,能够为 Agent 设定清晰的权限边界。企业不需要编写复杂的代码,只需用自然语言即可定义代理可用的工具、可访问的数据、允许执行的操作及其触发条件。无论工具来自 API、Lambda、MCP server,还是 Salesforce、Slack 等第三方服务,Agent 的每一次决策都会在毫秒级内通过 Amazon AgentCore Gateway 与策略进行比对,以确保所有行为都在授权范围内发生。
为了更好地评估 Agent 行为质量,Amazon AgentCore 推出了全新的 Evaluations 评估功能,并通过 13 个预置评估器覆盖 Agent 质量的关键维度,包括正确性、工具选择准确度、安全性、目标完成度、实用性和上下文相关性等。此外,Amazon AgentCore Evaluations 还会持续抽样分析 Agent 在真实环境下的行为变化。例如,当客服人员的满意度评分在 8 小时内下降了 10%,系统会立即触发警报,帮助团队在问题影响体验之前干预。
Amazon AgentCore Policy 和 Amazon AgentCore Evaluations 相当于给 Agent 增设了一个“防护网”,也给企业和 Agent 之间构建了信任基础——毕竟大家都不希望 Agent 强大到脱离掌控。Agent 在拥有高度自主性的同时,还是需要人类对其进行确定性控制。
纵观整场 Keynote,一个标志着时代变化的信号就是,以前云厂商都是发布实例和云服务,从今年开始变成了发布 Agent。作为 Agentic AI 的头部玩家,亚马逊云科技这次一出手就是三个 Frontier Agent,并且都是能够革新开发体验的 Agent:Kiro Autonomous Agent、Amazon Security Agent 以及 Amazon DevOps Agent。
Kiro Autonomous Agent 能在多次会话间保持持续上下文连贯,并不断学习用户的拉取请求与反馈。它能处理从缺陷分类到提升代码覆盖率等一系列任务,仅需一次跨库变更即可完成。目前,用户可以直接通过 GitHub 向其提问、描述任务或分配待办事项,Agent 将自主规划执行方案,并通过建议编辑和拉取请求返回变更结果,确保用户始终掌握代码合入的决策权。
Amazon Security Agent 将深度安全专业知识嵌入开发全生命周期,主动审查设计文档,并根据企业安全要求与常见漏洞扫描拉取请求。用户只需定义一次组织安全标准,Amazon Security Agent 便会在审查过程中自动验证应用程序的合规性。此外,该 Agent 还将渗透测试从缓慢的人工流程转变为按需可扩展的能力,匹配团队的开发速度。
Amazon DevOps Agent 通过全天候事件分类、引导式解决,以及针对多云及混合环境中应用可靠性和性能的持续优化建议,为团队减少告警干扰、保障稳定运维。当故障发生时,Amazon DevOps Agent 即时响应,运用其对应用及组件关联的认知快速定位根本原因。它能持续学习用户的资源体系及其关联关系,覆盖 Amazon CloudWatch、Dynatrace、Datadog、New Relic、Splunk 等可观测工具,以及运维手册、代码库和 CI/CD 流水线。
这三个 Agent 被定性为 Frontier Agent,在使用体验上,更接近国内所谓“数字员工”的概念,亚马逊云科技将其统一收拢在 Agentic AI 概念下,一方面是从技术和产品属性出发的概念界定,另一方面也是对 Agentic AI 战略的贯彻和执行,其核心词只有一个:让 AI 的价值得以落地——正如 Matt Garman 所言,AI Agent 能够代表人执行任务并实现工作自动化,这正是 AI 投资开始产生实质性商业回报的关键节点。
行业显然已经据此达成了共识,Reddit、Sony 等企业的实践案例就是最好的佐证。比如,Reddit 为了保障模型在多个安全维度审核聊天和搜索内容时的性能,使用 Amazon Nova Forge 将专有领域数据整合到预训练阶段后,首次生产出同时满足准确性和成本效益目标的专属模型。Sony 基于亚马逊云科技构建的 Sony Data Ocean,每天处理来自 500 多个数据源的 760TB 数据。通过将 Amazon Bedrock AgentCore 置于 Agentic AI 系统中心,Sony 能轻松实现管控、部署和管理更有用的 Agent 能力。
当然,这场 Keynote 对 Agentic AI 的回答,仅是一个起点, 2025 亚马逊云科技 re:Invent 还在继续,接下来的几日还会有更多重磅发布,InfoQ 也会持续关注,为读者带来更多报道。毕竟这场大会,可以算得上能决定整个行业接下来一年的讨论重心。
2025 亚马逊云科技 re:Invent 中国行即将启幕!12 月 18 日开始,北京、上海、深圳、成都四城线下巡演及线上专场将同步开启,无论你是云计算新手还是技术老兵,都将从高阶演讲、实战内容、技术分享和专家互动中受益。点击【链接】立即注册,抢占席位,把握 Agentic AI 时代的新机遇!







评论