
谷歌发布 Gemini CLI 扩展,一个开源框架,为开发者提供了一个构建和共享 Gemini CLI 智能体集成的平台。该框架引入了“剧本”的概念,通过结构化的指令,使人工智能能够与数据库、CI/CD 系统以及 API 等外部工具实现交互。借助社区精心打造的社区目录以及与 Dynatrace、Elastic、Figma、Shopify 和 Stripe 等知名企业的合作,Gemini CLI 扩展致力于成为开发者工作流中可扩展的、人工智能辅助的中心枢纽。
扩展框架通过模块化架构增强了 Gemini CLI 现有的功能。每个扩展都包含一个内置的“剧本”,为人工智能提供了清晰的指引,使其能够迅速掌握如何使用连接的工具,简化了复杂的设置流程。该框架支持在单个扩展中包含多个组件:一个或多个用于外部工具连接的 MCP 服务器、提供模型指令的上下文文件(如 GEMINI.md)、用于禁用内置功能的排除工具,以及用于复杂提示的自定义斜杠命令。
来源:扩展的解剖结构
扩展通过在原始工具连接之外添加智能层来增强模型上下文协议。尽管 MCP 能够提供基本的工具访问,Gemini CLI 扩展却将这种能力与上下文感知和个性化执行深度融合。系统会参考扩展中的“剧本”,并结合本地文件、Git 状态等环境上下文信息,精准地根据开发者的意图调用合适的工具。
在发布时,谷歌着重强调了其构建的包括第一方和第三方集成的开放生态系统。初始合作伙伴涵盖了关键的开发领域,包括可观测性和数据分析(Dynatrace、Elastic)、设计(Figma)、安全(Snyk)、CI/CD(Harness)以及 API 工具(Postman、Stripe)。谷歌的第一方扩展支持关键类别:云基础设施(Cloud Run、GKE)、应用开发(代码审查、Flutter、Firebase)以及数据/人工智能(BigQuery、Cloud SQL、Looker),展示了其在整个开发者工作流中的实用性。谷歌强调,任何人都可以构建和发布扩展,并鼓励开发者进行内部工具的开发,积极倡导社区贡献,同时也欢迎商业产品的加入。
该框架将 Gemini CLI 置于开放生态系统的核心位置,为所有开发者提供了构建集成的自由与便利。谷歌为此专门打造了一个扩展页面,按照 GitHub 上的受欢迎程度对现有的扩展进行了细致的分类与展示。谷歌为有兴趣创建和共享自定义扩展的开发者提供了模板和分步指南,既支持个人工作流优化,也支持企业内部工具集成。
社区的反应:
X 上的一位用户分享说:
非常酷。看到这个生态系统不断发展以及合作伙伴关系的建立,我感到非常兴奋!
一位用户提问 :
它们与“代码子智能体”有何不同?
另一位用户回答 :
这与子智能体完全不同。你可以把扩展想象成一种将多种功能整合在一起的“套装”,只需简单安装即可使用。它可能包含一个或多个 MCP 服务器、各种命令,以及如何(以及何时)使用这些 MCP 服务器的详细说明,当然还有许多其他功能。一旦 Gemini CLI 在未来推出子智能体支持,我敢肯定,这些功能也会出现在扩展中!
谷歌的 Gemini CLI 扩展进入了一个竞争激烈的领域,其他人工智能驱动的编码助手 CLI 工具也在不断拓展其可扩展性路径。Claude Code 借助模型上下文协议(MCP)实现可扩展性,通过斜杠命令、代理、MCP 服务器以及钩子提供定制化服务,Anthropic 更是推出了插件系统,方便用户共享自定义配置。Anthropic 最近推出了一种插件系统,让用户能够共享自定义设置。不过 OpenAI 的 Codex CLI 和 GitHub Copilot CLI 目前都没有提供类似的扩展框架或第三方集成市场,这使得谷歌基于目录的方法在人工智能驱动的 CLI 领域具备独特的优势。
【声明:本文由 InfoQ 翻译,未经许可禁止转载。】
查看英文原文:https://www.infoq.com/news/2025/10/gemini-cli-extensions/








评论