Stripe工程师部署了自主智能体Minions，每周生成数千个拉取请求

Stripe 的工程师开发了Minions，这是一个自主编程的智能体，能够根据单条指令端到端地完成软件开发任务。该系统实现了大语言模型（LLM）与内部开发者工具的集成，以极少的人工干预就能生成可直接用于生产环境的拉取请求（pull request）。Stripe 工程师表示，Minions 目前每周可生成超过 1300 个拉取请求，高于早期试验中的 1000 个。所有变更均会经过人工审核，但不包含任何人写的代码。

由 Minions 管理的代码支撑着 Stripe 每年超过 1 万亿美元的支付额，并运行在与金融机构、监管框架和合规性义务相关的复杂依赖关系中。在如此大规模的系统中部署自主智能体，可靠性与正确性仍是核心要求。

Stripe 的工程经理Cameron Bernhardt在 LinkedIn 的帖子中提到：

Minions 已经从概念发展到每周生成上千个拉取请求。所有代码都会经过人工审核，但智能体正越来越多地实现端到端地变更生成。

Minions 与GitHub Copilot这类交互式编程助手或Cursor这类 AI 代码编辑器不同，它执行一次性、端到端的任务。任务可以来自多个源，包括 Slack 对话、缺陷报告或功能需求。任务描述会发送给 Minion，然后 Minion 使用蓝图（一组确定性代码与灵活智能体循环的组合）来编排工作，生成所需的代码、测试和文档。工作流最终会提交一个拉取请求供人工审核，这样工程师从任务定义到可上线的代码只需极少的手动操作。

调用 Minion 的 Slack 消息示例（来源：Stripe的博客文章）

该系统由 Block 开发的Goose的内部分支演进而来，Goose 是最早得到广泛应用的编程智能体之一。针对 Stripe 的 LLM 基础设施，Goose 进行了定制，并为满足 Minions 的特定需求做了优化，而 Cursor、Claude Code 等交互式工具继续支持人工监督的工作流。

Minions通过蓝图（blueprints）进行编排，蓝图是用代码定义的工作流，规定如何将任务拆分为子任务，并根据任务类型由确定性的例程（routine）或智能体来进行处理。Stripe 工程师将蓝图描述为与代码交织在一起的智能体技能集合，在保证效率的同时保留了适应性。

Minion 示例蓝图（来源：Stripe的博客文章）

系统通过 CI/CD 流水线、自动化测试和静态分析来强化可靠性，确保生成的变更在人工审核前符合工程标准。工程师指出，Minions 在定义明确的任务上表现最佳，例如配置调整、依赖升级和小型重构。

该系统反映了智能体驱动软件开发的广泛趋势：基于 LLM 的智能体与开发环境、版本控制和 CI/CD 流水线深度集成，以极少的监督生成生产级的代码。Stripe 的经验表明，自主编程智能体可以显著提升开发者的生产力，同时保持严格的质量控制。

查看英文原文：Stripe Engineers Deploy Minions, Autonomous Agents Producing Thousands of Pull Requests Weekly

创作场景

Stripe 工程师部署了自主智能体 Minions，每周生成数千个拉取请求