写点什么

Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流

作者:Robert Krzaczyński
  • 2026-04-23
    北京
  • 本文字数:850 字

    阅读完需:约 3 分钟

谷歌在 Gemini CLI 中引入了子代理(subagents)功能,这是一项新能力,旨在帮助开发者将复杂或重复性的任务委派给在主会话旁协同运行的专用 AI 代理。

 

该功能允许主代理充当“协调者”,将代码分析、调研或测试等子任务分配给不同的专用子代理。每个子代理都在隔离环境中运行,并将汇总后的结果返回主会话,从而减少上下文负载,并在长时间交互过程中提升性能。

 

据谷歌介绍,这种方式旨在解决代理工作流中的常见问题,尤其是中间步骤不断累积所带来的响应变慢和成本上升。通过将细粒度操作下放给子代理,主代理可以专注于更高层级的推理和最终结果输出。

 

子代理还支持并行运行,使多个任务能够同时执行。例如,开发者可以让系统同时分析代码库的不同部分,或并行开展多项调研任务。虽然这有助于缩短整体执行时间,但谷歌也指出,并行执行可能带来一些风险,例如代码修改冲突,以及由于并发请求导致的使用额度增加。

 

该功能的一个重要特点是高度可定制化。开发者可以通过带有 YAML 配置的 Markdown 文件创建自定义子代理,从而定义其角色、可用工具以及行为规范。这些代理可以保存在本地或代码仓库中,使团队能够在项目间统一工作流或规范编码实践。此外,谷歌还提供了一些内置子代理,例如通用助手、命令行(CLI)助手以及代码库分析代理。

 

系统还支持通过提示语语法进行显式任务委派,允许用户直接将任务分配给特定代理。这使开发者能够更精细地控制任务分发,而不必完全依赖自动路由机制。

 

这一发布凸显了多代理架构的发展趋势,即通过多个组件分别处理特定任务,而不是依赖单一模型,从而在复杂开发流程中提升系统的可扩展性和可维护性。

 

不过,早期用户的反馈显示,整体开发者体验仍有改进空间。有评论指出当前存在的一些问题:

谷歌应当在 gemini-cli 的稳定性以及 UI/UX 上投入更多精力。目前即使是 Pro 版本,整体体验也相当一般。模型本身表现不错,但工具链还需要进一步打磨。

 

尽管子代理的引入拓展了 Gemini CLI 的能力,其实际普及程度仍将取决于在功能迭代的同时,相关可用性和稳定性问题能否得到及时解决。