
谷歌为 Android Studio 推出了集成了 Gemini 的 Agent Mode,并已在最新的 Narwhal 预览版中上线。该功能的设计目标是自动化处理跨文件的多步骤开发任务。
通过超越以往简单的聊天交互,Agent Mode 将 Gemini 在 Android Studio 中的集成提升到了一个新的水平。具体来说,Agent Mode 使用整个项目作为上下文,而不仅仅是聊天窗口的内容。它与 IDE 的深度集成也使其能够直接修改项目,而不仅仅是建议供复制和粘贴的代码片段。最重要的是,它可以执行多步骤的任务。
使用 Agent Mode,你可以直接用自然语言下达复杂指令(如生成单元测试或进行代码重构),它就会制定并执行一个覆盖多个文件的行动方案,并在你的指导下执行。
你可以要求 Agent Mode 执行的任务示例包括:构建项目并修复所有错误、提取硬编码字符串并将其迁移到 strings.xml 文件、为现有应用程序添加深色模式支持等等。
该代理会一步一步地执行所请求的任务,允许开发者审查这些变更。如果他们不满意,可以提供反馈并要求 Agnet 根据反馈提供新的解决方案,直到结果满足他们的期望。
Agent Mode 可以通过MCP与外部工具交互,例如直接从 Android Studio 创建一个拉取请求(pull request),或使用任何当前可用的 MCP 服务器。此预览版中对 MCP 的初步支持尚不完整,目前仅支持 stdio 传输,计划在未来版本中支持 Streamable HTTP 传输,以及外部上下文资源和提示模板。
Agent Mode 可以使用 Gemini 的免费套餐,但其支持的上下文窗口有限。或者,你也可以升级到 Gemini 1.5 Pro 来使用一百万 token 的上下文窗口。
谷歌强调,Agent Mode 对于处理那些常规、耗时的任务特别有用,有助于解放开发者的时间,让他们能专注于更具创造性的工作。此举可谓一举两得:一方面是巧妙地管理外界期望,让开发者正确认识该工具能为工作流带来的实际价值;另一方面也暗示了它在日常工作中的最佳使用方式。
由于这仍是一个预览版本,并非所有功能在每种场景下都能完美运行。Gemini in Android Studio 的 Agent Mode 的早期采用者已经报告了一些不足之处,例如有用户报告称,该工具似乎无法调用外部工具来访问或修改源文件。谷歌已经意识到了这些问题,并正在积极努力解决它们。
原文链接:https://www.infoq.com/news/2025/06/gemini-agent-mode-android-studio/
评论