写点什么

谷歌推出全新的设备端 GenAI API,将 Gemini Nano 引入 ML Kit

  • 2025-06-05
    北京
  • 本文字数:1165 字

    阅读完需:约 4 分钟

大小:453.67K时长:02:34
谷歌推出全新的设备端GenAI API,将Gemini Nano引入ML Kit

ML Kit 新加入的 GenAI API 使开发者能够在 Android 应用中使用 Gemini Nano 进行本地推理,支持诸如总结、校对、改写和图像描述等功能。


例如,你可以对长达 3000 个英文单词的文档进行总结,可以让文本风格更加正式或更加随性,还可以生成标题、元数据或替代图像描述。


在本地运行意味着所有数据,包括输入、推理和输出,都不会离开本地设备,并且不会产生任何云端成本。谷歌表示,GenAI API 的设计注重易于集成和使用,提供了与其他 ML Kit API 类似的高级抽象。


这意味着你可以直接获得高质量的结果,无需额外进行提示词工程或针对特定用例进行微调。


这是通过将每个专门的 API 构建为一个组件栈来实现的,以 Gemini Nano 作为共同基础。Nano 上面是一个小型的、特定于 API 的 LoRA 适配器模型,用于提高性能,接着是一层定义优化推理参数(如提示词、温度、top-K 和批次大小)的层。最后,评估管道结合了自动化评估器、统计指标和人工评估器,以进一步改进生成的响应。


采用这种方法实现的性能提升通过基准分数来衡量,这些基准分数是为每个 API 定制的,考虑了特定属性,例如文本总结中的事实一致性。这些基准表明所有 API 的性能都有了一致的提升,如下图所示。



ML Kit GenAI API 支持流式和非流式工作流程。流式工作流特别适合需要较长响应的场景,因为它能够在不等待整个响应生成完成的情况下逐步输出内容。


在使用 GenAI API 时,ML Kit 会自动下载 Gemini Nano 和任何所需的特定于 API 的模型。开发者也可以控制这个过程,并选择提前下载模型。假设所有所需的模型都已下载,下面的代码片段演示了总结 API 的工作流程:


val articleToSummarize = ...
val summarizerOptions = SummarizerOptions.builder(context)    .setInputType(InputType.ARTICLE)    .setOutputType(OutputType.ONE_BULLET)    .setLanguage(Language.ENGLISH)    .build()val summarizer = Summarization.getClient(summarizerOptions)
val summarizationRequest = SummarizationRequest.builder(text).build()summarizer.runInference(summarizationRequest) { newText ->    // Show new text in UI}
复制代码


为了确保所有所需功能都可在本地使用,开发者可以调用 summarizer.checkFeatureStatus 方法。


借助 AICore ,ML Kit GenAI API 在搭载了优化的联发科天玑、高通骁龙和谷歌 Tensor 平台的 Android 设备上可用。支持的设备包括 Pixel 9 系列、三星 Galaxy 25、小米 15、摩托罗拉 Razr 60 Ultra 等。


对于有意向开始使用 ML Kit GenAI API 的开发者来说,可以将官方的 ML Kit GenAI API 演示应用作为入手点,它演示了所有新功能,还搭配了官方文档,为开发者提供了更深入的指导。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


查看英文原文https://www.infoq.com/news/2025/06/google-mlkit-genai-gemini-nano/

2025-06-05 15:006603

评论

发布
暂无评论

Presto 内存参数设置建议

冰心的小屋

presto memory query.max-memory presto 内存

C++实现一键关闭桌面

芯动大师

Redis Sentinel 初步设计方案

艾瑾行

架构训练营

成为大主播的必懂知识:直播源码推流

山东布谷网络科技

直播推流 直播源码

柏睿向量数据库Rapids VectorDB赋能企业级大模型构建及智能应用

新消费日报

使用 Spring 实现控制反转和依赖注入

小万哥

Java spring 云原生 后端 SpringCloud

局域网与Kubernetes内部网络如何互通

程序员半支烟

k8s

Similarities:精准相似度计算与语义匹配搜索工具包,多维度实现多种算法,覆盖文本、图像等领域,支持文搜、图搜文、图搜图匹配搜索

汀丶人工智能

人工智能 自然语言处理 语义搜索 语义搜索系统 文本匹配

SpringBoot3数据库集成

Java 架构 springboot SpringBoot3

绝了!学编程的还有不知道的吗?这个Java开发工具免费了

飞算JavaAI开发助手

开发者工具 开发工具 java\ 智能开发

《企业家》杂志封面人物丨王文京:数智化助企业“基因迭代”

用友BIP

网络安全作业

大肚皮狒狒

《MySQL——从删库到跑路》阿里架构师分享删库跑路救命策略

java易二三

Java 程序员 计算机

java8 通过反射执行接口的default方法

java易二三

Java 程序员 计算机

精细解析中文公司名称:智能分词工具助力地名、品牌名、行业词和后缀提取

汀丶人工智能

人工智能 自然语言处理 信息抽取

山东布谷科技直播软件开发WebRTC技术:建立实时通信优质平台

山东布谷科技

软件开发 WebRTC 实时通信 源码搭建 直播软件开发

第二届广州·琶洲算法大赛报名截止 3300多支队伍将展开激烈角逐

新消费日报

数智双擎,算融未来”,2023东湖算力与大数据创新大会圆满召开

彭飞

网上正规实体现场同步平台

新百盛娱乐yscy898

大型模型的重要基石与洞察力之源之文本数据

数据堂

全新 – Amazon EC2 M1 Mac 实例

亚马逊云科技 (Amazon Web Services)

Amazon EC2

深入浅出java Semaphore

java易二三

程序员 jdk 计算机 科技

网上正规实体平台现场同步yscy898

新百盛娱乐yscy898

上线规则 微咨询 Fil币现在进场合适吗? 简单查询

2023-08-12:用go语言写算法。实验室需要配制一种溶液,现在研究员面前有n种该物质的溶液, 每一种有无限多瓶,第i种的溶液体积为v[i],里面含有w[i]单位的该物质, 研究员每次可以选择一瓶

福大大架构师每日一题

左程云 福大大架构师每日一题

谷歌推出全新的设备端GenAI API,将Gemini Nano引入ML Kit_AI&大模型_Sergio De Simone_InfoQ精选文章