Stripe 的工程师开发了Minions,这是一个自主编程的智能体,能够根据单条指令端到端地完成软件开发任务。该系统实现了大语言模型(LLM)与内部开发者工具的集成,以极少的人工干预就能生成可直接用于生产环境的拉取请求(pull request)。Stripe 工程师表示,Minions 目前每周可生成超过 1300 个拉取请求,高于早期试验中的 1000 个。所有变更均会经过人工审核,但不包含任何人写的代码。
由 Minions 管理的代码支撑着 Stripe 每年超过 1 万亿美元的支付额,并运行在与金融机构、监管框架和合规性义务相关的复杂依赖关系中。在如此大规模的系统中部署自主智能体,可靠性与正确性仍是核心要求。
Stripe 的工程经理Cameron Bernhardt在 LinkedIn 的帖子中提到:
Minions 已经从概念发展到每周生成上千个拉取请求。所有代码都会经过人工审核,但智能体正越来越多地实现端到端地变更生成。
Minions 与GitHub Copilot这类交互式编程助手或Cursor这类 AI 代码编辑器不同,它执行一次性、端到端的任务。任务可以来自多个源,包括 Slack 对话、缺陷报告或功能需求。任务描述会发送给 Minion,然后 Minion 使用蓝图(一组确定性代码与灵活智能体循环的组合)来编排工作,生成所需的代码、测试和文档。工作流最终会提交一个拉取请求供人工审核,这样工程师从任务定义到可上线的代码只需极少的手动操作。

调用 Minion 的 Slack 消息示例(来源:Stripe的博客文章)
该系统由 Block 开发的Goose的内部分支演进而来,Goose 是最早得到广泛应用的编程智能体之一。针对 Stripe 的 LLM 基础设施,Goose 进行了定制,并为满足 Minions 的特定需求做了优化,而 Cursor、Claude Code 等交互式工具继续支持人工监督的工作流。
Minions通过蓝图(blueprints)进行编排,蓝图是用代码定义的工作流,规定如何将任务拆分为子任务,并根据任务类型由确定性的例程(routine)或智能体来进行处理。Stripe 工程师将蓝图描述为与代码交织在一起的智能体技能集合,在保证效率的同时保留了适应性。

Minion 示例蓝图(来源:Stripe的博客文章)
系统通过 CI/CD 流水线、自动化测试和静态分析来强化可靠性,确保生成的变更在人工审核前符合工程标准。工程师指出,Minions 在定义明确的任务上表现最佳,例如配置调整、依赖升级和小型重构。
该系统反映了智能体驱动软件开发的广泛趋势:基于 LLM 的智能体与开发环境、版本控制和 CI/CD 流水线深度集成,以极少的监督生成生产级的代码。Stripe 的经验表明,自主编程智能体可以显著提升开发者的生产力,同时保持严格的质量控制。
查看英文原文:Stripe Engineers Deploy Minions, Autonomous Agents Producing Thousands of Pull Requests Weekly





