
ML Kit GenAI Prompt API 现已发布 Alpha 版,Android 开发者能够向设备端运行的 Gemini Nano 发送自然语言和多模态请求,把 GenAI 首次发布时引入的文本摘要和图像描述能力又往前推进了一步。
新 API 支持纯文本输入或图像与文本的组合输入,并输出文本响应。谷歌表示,它支持在多种移动使用场景中使用自然语言提示词,包括简短翻译、图像与文本分类、内容生成等:
Prompt API 突破了预置功能的边界,支持定制、应用专有的 GenAI 使用场景,让你能够借助复杂数据转换创建独特功能。Prompt API 利用设备端的 Gemini Nano 在本地处理数据,实现离线能力并提升用户隐私。
与现有针对特定功能(如摘要、校对、改写、图像描述)的 GenAI API 相比,新的 Prompt API 是一种更低层级的接口,需要做更多的集成工作,但具备了更大的灵活性。
功能专属 API 内置了针对其特定场景优化的提示词,开发者无需进行提示词工程,但也带来一些限制。例如,摘要 API 将输出限制为 1 至 3 个要点;图像描述 API 只生成简短、通用的说明;改写 API 仅支持固定风格,如详尽的、缩短的、友好的,等等。
相比之下,Prompt API 则允许开发者提供自定义提示词,从而提升了灵活性。例如,以下代码片段展示了通过一个完全定制的提示词指导设备端模型如何处理图像:
谷歌表示,新 Prompt API 已被合作伙伴集成,如 Kakao Mobility,他们利用该功能让用户只需拍摄一张照片并附带自定义提示词即可告知用户自行车是否违停。Kakao Mobility 还使用 Prompt API 提升其应用内的地址输入体验。
Prompt API 在运行 Nano-v3 的 Pixel 10 系列设备上表现最佳。不过,它也可用于其他设备,包括 Google Pixel 9 系列、Samsung Galaxy Z Fold7、Xiaomi 15 等,但仅支持能力较弱的 Nano-v2 模型。
JobNimbus 首席 AI 官 Tyler Folkman 在 LinkedIn 上评论称,Kakao 的实测结果“表明这不仅是一项 AI 演示功能”。他还认为,尽管尚未达到生产就绪状态,Prompt API 在“隐私不可妥协且硬件可控的受控环境中”具有一定的前景。Folkman 进一步指出了 Prompt API 与 Android 的集成存在的一些限制,例如强制要求电池配额以及缺乏后台运行支持。
【声明:本文由 InfoQ 翻译,未经许可禁止转载。】
查看英文原文:https://www.infoq.com/news/2025/11/android-genai-prompt-api/








评论