Android Studio Otter 优化代理工作流程,增强 LLM 灵活性

  • 2026-01-22
    北京
  • 本文字数:1103 字

    阅读完需:约 4 分钟

Android Studio Otter 的最新版本引入了多项新特性,使开发者可以更轻松地将 AI 驱动的工具集成到他们的工作流程中,包括选择使用哪个大型语言模型(LLM)、通过设备交互实现增强型代理模式、支持自然语言测试等。

 

LLM 灵活性是指开发者可以选择使用哪个 LLM 为 Android Studio 中的 AI 功能提供支持。虽然 IDE 默认包含一个 Gemini 模型,但开发者现在可以集成一个单独的远程模型,包括 OpenAI 的 GPT 和 Anthropic 的 Claude,或者使用 LM Studio 或 Ollama 等运行一个本地模型。谷歌表示,本地模型特别适合那些“互联网连接受限、数据隐私要求严格或希望尝试开源研究成果”的开发者,不过它们需要大量的本地 RAM 和硬盘空间才能有效运行。

 

偏好 Gemini 的开发者现在可以使用自己的 Gemini API 密钥访问更高级的版本,以及扩展后的上下文窗口和配额,在使用代理模式进行长时间编码会话时,这可能很重要。

 

Android Studio Otter 还通过让代理“看到”并与应用程序交互来增强代理模式。这包括在设备或模拟器上部署和检查应用程序,通过捕获屏幕截图和分析屏幕内容来调试应用程序 UI,以及检查 Logcat 以查找错误。

 

Android Studio Otter 的另一个主要特性是通过 “Journey” 支持自然语言测试,这使得开发者可以用简单英语定义用户 Journey 测试,Gemini 会将这些指令转换为可执行的测试步骤。

 

这不仅使你可以更轻松地编写测试,而且编写出来的测试更容易理解。它还使你能够定义复杂的断言,让 Gemini 根据在设备屏幕上“看到”的内容进行评估。因为 Gemini 会推理如何实现你的目标,所以这些测试能更好地应对应用程序布局的微妙变化,在面对不同应用程序版本或设备配置时显著减少测试结果的不稳定性。

 

该 IDE 专门提供了一个基于 XML 的编辑器(管理这些 Journey )以及一个测试面板(显示每个动作的屏幕截图以及 Gemini 执行每个步骤的原因)。

 

Android Studio 现在还支持模型上下文协议(MCP),允许 AI 代理连接到 Figma、Notion 和 Canva 等远程服务器。例如,通过连接到 Figma,代理模式可以直接访问设计文件,生成更准确的 UI 代码,减少了在不同的工具之间手动复制粘贴上下文的需求。

 

最后,本次更新引入了一个专门的 UI ,用于审查编码代理编辑过的每个文件。它允许开发者查看代码差异,并选择保留或单个或全部撤销更改。此外,它现在可以管理多个聊天线程,使不同的任务(如 UI 设计和 Bug 修复)可以同时执行,而不会丢失上下文。

 

Otter 的特性更新比这里提到的要多许多,如经过改进的应用链接助手、 Logcat 自动回溯等。要了解完整的特性更新信息,请查阅发布公告原文。

原文链接:

https://www.infoq.com/news/2026/01/android-studio-otter-llm-flex/