智能体刷屏的背后,是 AI 应用拐点的来临?AICon 北京站议程重磅公布,50+ 硬核分享不容错过 了解详情
写点什么

谷歌推出全新的设备端 GenAI API,将 Gemini Nano 引入 ML Kit

  • 2025-06-05
    北京
  • 本文字数:1165 字

    阅读完需:约 4 分钟

大小:453.67K时长:02:34
谷歌推出全新的设备端GenAI API,将Gemini Nano引入ML Kit

ML Kit 新加入的 GenAI API 使开发者能够在 Android 应用中使用 Gemini Nano 进行本地推理,支持诸如总结、校对、改写和图像描述等功能。


例如,你可以对长达 3000 个英文单词的文档进行总结,可以让文本风格更加正式或更加随性,还可以生成标题、元数据或替代图像描述。


在本地运行意味着所有数据,包括输入、推理和输出,都不会离开本地设备,并且不会产生任何云端成本。谷歌表示,GenAI API 的设计注重易于集成和使用,提供了与其他 ML Kit API 类似的高级抽象。


这意味着你可以直接获得高质量的结果,无需额外进行提示词工程或针对特定用例进行微调。


这是通过将每个专门的 API 构建为一个组件栈来实现的,以 Gemini Nano 作为共同基础。Nano 上面是一个小型的、特定于 API 的 LoRA 适配器模型,用于提高性能,接着是一层定义优化推理参数(如提示词、温度、top-K 和批次大小)的层。最后,评估管道结合了自动化评估器、统计指标和人工评估器,以进一步改进生成的响应。


采用这种方法实现的性能提升通过基准分数来衡量,这些基准分数是为每个 API 定制的,考虑了特定属性,例如文本总结中的事实一致性。这些基准表明所有 API 的性能都有了一致的提升,如下图所示。



ML Kit GenAI API 支持流式和非流式工作流程。流式工作流特别适合需要较长响应的场景,因为它能够在不等待整个响应生成完成的情况下逐步输出内容。


在使用 GenAI API 时,ML Kit 会自动下载 Gemini Nano 和任何所需的特定于 API 的模型。开发者也可以控制这个过程,并选择提前下载模型。假设所有所需的模型都已下载,下面的代码片段演示了总结 API 的工作流程:


val articleToSummarize = ...
val summarizerOptions = SummarizerOptions.builder(context)    .setInputType(InputType.ARTICLE)    .setOutputType(OutputType.ONE_BULLET)    .setLanguage(Language.ENGLISH)    .build()val summarizer = Summarization.getClient(summarizerOptions)
val summarizationRequest = SummarizationRequest.builder(text).build()summarizer.runInference(summarizationRequest) { newText ->    // Show new text in UI}
复制代码


为了确保所有所需功能都可在本地使用,开发者可以调用 summarizer.checkFeatureStatus 方法。


借助 AICore ,ML Kit GenAI API 在搭载了优化的联发科天玑、高通骁龙和谷歌 Tensor 平台的 Android 设备上可用。支持的设备包括 Pixel 9 系列、三星 Galaxy 25、小米 15、摩托罗拉 Razr 60 Ultra 等。


对于有意向开始使用 ML Kit GenAI API 的开发者来说,可以将官方的 ML Kit GenAI API 演示应用作为入手点,它演示了所有新功能,还搭配了官方文档,为开发者提供了更深入的指导。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


查看英文原文https://www.infoq.com/news/2025/06/google-mlkit-genai-gemini-nano/

2025-06-05 15:001

评论

发布
暂无评论

Go必知必会:掌握Go语言中的Channel,并发编程的核心

王中阳Go

并发 channel Go 语言 GO语言编程

对接开源大模型应用开发平台最佳实践

阿里云大数据AI技术

人工智能 LLM rag OpenSearch dify

替换传统数据处理平台,TDengine 与华风数据达成合作

TDengine

数据库 tdengine 时序数据库

GreatSQL 异步复制及搭建

GreatSQL

StarRocks 培训课程重磅上线!专家出品,助你升级打怪不走弯路!

StarRocks

健康产业怎么定义?需要用到堡垒机吗?

行云管家

网络安全 数据安全 堡垒机 健康产业

人事管理这些“坑”,你有没有踩过?

天津汇柏科技有限公司

人工智能 低代码开发 人事管理系统

如何高效的匹配、筛选数据,避免嵌套循环

六哥是全栈

Java ts 开发技巧

Spring webflux注解:提供全面的JPA注解应用案例(必须收藏)

肖哥弹架构

spring spring webflux

从数据洞察到智能决策:合合信息&infiniflow RAG技术的实战案例分享

汀丶人工智能

rag

性能测试 | JMeter 介绍与安装

测吧(北京)科技有限公司

测试

Qt使用kingbase数据库存储数据(完成考勤系统数据增删改查)

DS小龙哥

9月日更

IP纯净度对跨境电商有哪些影响

IPIDEA全球HTTP

Cisco Catalyst 9100 无线接入点 IOS XE 17.15.1 发布下载,新增功能概览

sysin

Cisco ap 思科 IOS XE 9100

火山引擎携手招商银行共探智能体应用,加速数字金融创新

新消费日报

化“腐朽”为“神奇”:5 种 RAG 优化技术应对千奇百怪的 Query

Baihai IDP

程序员 AI rag Baihai IDP 企业 9 月 PK 榜

鸿蒙NEXT生态应用核心技术理念:一次开发,多端部署

芯盾时代

鸿蒙 物联网 国产化替代

支撑AI的算力芯片,未来何去何从?

博文视点Broadview

GitHub Star 数量前 13 的自托管项目清单

NocoBase

GitHub 开源 自托管 self-hosted

防城港等保测评机构有哪些?在哪里?

行云管家

等保 等级保护 防城港

数据飞轮转进快递行业 能够为企业带来哪些新想象

字节跳动数据平台

数字化转型 云服务 数据平台 火山引擎 数据飞轮

公开课 | 金九银十,测试开发面试秘籍大公开!

测吧(北京)科技有限公司

测试

性能测试 | JMeter 介绍与安装

测试人

软件测试

直播预约丨《袋鼠云大数据实操指南》No.6:建设指标管理平台 解锁企业数据价值

袋鼠云数栈

大数据

NGINX 和 HAProxy:基于公有云标准环境的用户体验测试对比

NGINX开源社区

读书笔记 开源 最佳实践 反向代理 HAProxy

报名啦|PolarDB数据库创新设计赛(天池杯)等你来战

阿里云数据库开源

数据库大赛 国赛 阿里云PolarDB

谷歌推出全新的设备端GenAI API,将Gemini Nano引入ML Kit_AI&大模型_Sergio De Simone_InfoQ精选文章