为什么大量企业Agent死在原型阶段？亚马逊云科技储瑞松：Agent工程是关键

“Agentic AI 的爆发拐点已经到来。”亚马逊全球副总裁、亚马逊云科技亚太区联席总裁储瑞松表示。推动这一拐点出现的，不只是大模型能力的持续跃迁，更是 Agentic 工程体系的快速成熟。

亚马逊云科技全球数据库服务副总裁 Ganapathy “G2” Krishnamoorthy 进一步指出，Agentic AI 的核心变化在于，AI 正从一次性问答工具，转向能够持续理解上下文、调用工具、执行任务并不断学习的数字劳动力。企业竞争的关键，也将从“有没有使用 AI”，转向“能否把每一次任务都变成下一次任务的智能积累”。

他指出，未来的 AI Agent 将覆盖多类关键场景，包括改变员工工作方式的 Agent、提升安全与合规能力的 Agent、能够理解并交付软件的 Agent，以及帮助企业自行创建智能体的平台能力。

模型能力与工程体系形成飞轮

储瑞松认为，过去两年多里，Agentic AI 的底层支撑正在发生关键变化。一方面，大模型能力在快速竞争中持续突破，从推理能力、代码生成到多模态理解，模型的智能水平不断跨越新的门槛。另一方面，基于模型能力的 Agentic 工程体系也在快速成熟。

“二者正在形成一个相互促进的飞轮：模型能力不断提升，让智能体具备更强的推理、代码生成和多模态理解能力；而成熟的 Agentic 工程实践，又把真实业务场景中的反馈传导回模型迭代过程，进一步指引模型能力的突破方向。”

他将 Agentic 工程体系定义为，把模型能力转化为可稳定交付业务结果的智能体的系统化工程能力。这个体系并不是单一技术点，而是一套围绕模型、上下文、工具、流程、评估和治理构建起来的综合工程框架。

Agentic 工程体系的演进可以分为三层：

第一层，早期行业广泛关注的 Prompt Engineering，重点是通过更有效的提示词，让模型理解用户希望它完成什么任务。
第二层，Context Engineering，重点是如何在合适的时机，向模型提供正确的信息、工具和记忆，让模型不仅知道“要做什么”，也掌握“完成任务需要知道什么”。
第三层是最近半年成为行业焦点的 Harness Engineering，它更进一步强调围绕模型搭建稳定执行框架，包括智能体循环、工具调用、任务评估、失败重试和安全护栏等机制，让模型不仅能理解任务，也能可靠地把事情做完。

围绕企业如何实现 Agentic 业务转型，储瑞松提出，企业首先要从工具导向转向业务结果导向。过去，不少企业推进 AI 项目时，关注点往往停留在选择什么模型、采购什么工具、搭建什么系统。但在 Agentic AI 时代，真正重要的问题是：企业到底希望 AI 带来什么业务结果。只有先定义清楚业务目标，模型选择、数据准备、工作流设计和平台建设才有明确方向。

对于希望启动第一个智能体项目的企业，储瑞松建议，起步场景无需过于复杂，但必须具备真实业务价值。理想场景应有明确的起点、终点和业务目标，需要智能体在多个系统和工具之间进行选择与判断，同时拥有可衡量的成功标准。此外，这类场景还应具备安全的失败模式，即便智能体执行出错，也不会造成不可逆后果。此外，企业还需要明确智能体的边界，包括自主程度、管辖范围，以及人机协作中的审核分工。

储瑞松提出，一个实用方法是像为新员工撰写岗位说明书一样定义智能体：明确它的职责范围、交付标准、权限边界和出错预案，并将其与业务 KPI 直接关联。这样一来，企业从启动第一个智能体工作流开始，就能够衡量其业务价值，并逐步扩展到更多 Agentic AI 工作流。

其次，数据也将成为企业最重要的护城河之一。在 Agentic AI 时代，数据不再只是静态资产，而会变成持续驱动智能体为企业创造价值的战略资产。企业多年积累的行业知识、客户数据、运营流程和业务经验，将成为其智能体系统最难被复制的竞争壁垒。

与此同时，Agentic 平台将成为概念验证与生产部署之间的分界线。当企业只是做几个智能体试点时，可以依赖局部工具和单点方案；但当企业要让成百上千个智能体与员工协同，甚至让智能体之间相互协作时，就必须依赖统一平台进行开发、部署、管理、评估和治理。平台能力决定了智能体能否从试验走向规模化生产。

此外，储瑞松还强调，信任和治理是发展的加速器，而不是刹车。企业也需要建立新的角色、流程、责任和管理体系，来协调人类员工与智能体之间的协作关系。

企业需要理解上下文的 Agent

“对许多企业员工而言，今天的工作方式已经越来越难以支撑高效协作。”Krishnamoorthy 表示，员工并不真正关心某个任务要在哪个工具里完成，他们真正关心的是，一个想法能否被快速推进、一个客户问题能否被及时响应，一个变更能否真正落地。但现实是，员工不得不在不同系统之间反复切换，承担“连接信息、判断下一步、推动任务流转”的操作员角色。

更大的问题是，许多 AI 工具虽然可以连接企业工具，但它们往往只回答一个问题，然后就忘记上下文。它们在孤立会话中运行，只理解单次请求、单一数据源，却不了解用户与谁协作、正在做什么项目，也无法把分散的业务流程连接成真正的智能系统。

Krishnamoorthy 认为，如果团队仍然需要人类不断连接信息点，如果用户仍然被迫充当工作流中的人工操作员，那么 AI 能够释放的效率就会被严重限制。领先组织之所以能够跑得更快，不只是因为执行速度更快，而是因为它们正在让每一项任务都为下一项任务积累智能。

真正改变工作方式的 Agent，必须能够跨越企业业务、数据和工具运行，并随着每一次查询、每一次活动持续学习。这样一来，用户在第 100 天获得的答案，应该比第 1 天更准确、更贴合业务环境。这意味着 Agent 不只是一个聊天界面，而应具备持续记忆、权限管理、上下文理解和跨系统执行能力。它需要知道谁在行动、哪些数据被访问、数据来自哪里，以及当前策略是否允许该操作。

企业长期面对一个矛盾：安全与速度似乎总是互相牵制。一边是快速开发、快速发布、快速响应客户需求；另一边是安全审查、漏洞检测、合规验证和风险控制。过去，安全经常被视为拖慢进度的环节。

但在 Agentic AI 时代，这种权衡关系不应继续存在。Krishnamoorthy 认为，企业安全正在从“存储、查询、仪表盘和告警”的世界，走向“上下文、推理和访问控制”的世界。没有上下文的安全信号只是噪声，只有结合企业具体环境、架构、权限和业务逻辑，安全系统才能真正判断风险优先级。

软件交付成为关键战场

除了工作流和安全，软件开发是 Agentic AI 落地的另一条主线。Krishnamoorthy 表示，几乎每一个 Agent、每一个工作负载、每一个业务站点，最终都会以软件形式交付给客户。因此，软件交付是企业创新速度能否真正转化为业务价值的关键环节。

今天，代码生成已经变得越来越便宜，也不缺少可以快速生成代码的工具。但对企业项目来说，真正困难的不是写出一段代码，而是理解企业环境、开发标准、系统架构和既有约束。一个不了解企业上下文的代码生成工具，可能会制造更多技术债，而不是提升工程效率。

亚马逊云科技认为，企业需要的不是单点代码生成，而是覆盖需求理解、系统设计、实现、测试、验证和发布的完整软件交付能力。Agent 应该能够理解项目结构、架构约束和测试要求，并在发布前完成验证，确保代码不仅“能写出来”，也“能正确交付”。

随着 Agent 写代码速度提升，软件流水线本身也必须同步升级。如果 Agent 让代码产出速度提升 10 倍，但企业的发布管线仍然以旧速度运转，最终瓶颈只会从“写代码”转移到“测试、审核和上线”。

因此，企业需要让发布管理也具备 Agentic 能力。代码生成之后，系统应能自动接管后续流程，包括审查变更、搭建环境、运行测试、发现失败、修复问题，并在问题影响客户之前完成验证。

未来的软件交付将从“人类推动流水线”转向“Agent 协调流水线”。多个 Agent 可以共同维护持续流动的开发、测试和发布流程，让企业在加快交付的同时，避免技术债持续积累。

亚马逊云科技进一步指出，今天许多企业的 Agent 仍卡在原型阶段，无法真正进入生产环境。原因不是模型不够强，而是企业缺少生产级 Agent 所需的基础设施，包括认证、记忆、长任务执行、安全、治理、工具接入、策略控制和运行环境。

在亚马逊云科技看来，企业不能只关注 Agent 本身，而应关注支撑 Agent 进入生产的完整平台。模型可以被视为“大脑”，而 Harness 或平台能力则是“身体”和“安全系统”。没有后者，再聪明的模型也很难可靠地完成企业级任务。

创作场景

为什么大量企业 Agent 死在原型阶段？亚马逊云科技储瑞松：Agent 工程是关键

模型能力与工程体系形成飞轮

企业需要理解上下文的 Agent

软件交付成为关键战场