写点什么

谷歌发布 Gemma 3n 预览版和设备函数调用 SDK

作者:Steef-Jan Wiggers

  • 2025-06-02
    北京
  • 本文字数:1092 字

    阅读完需:约 4 分钟

大小:421.60K时长:02:23
谷歌发布Gemma 3n预览版和设备函数调用SDK

谷歌发布 Gemma 3n 预览版,可在新的 LiteRT Hugging Face 社区中找到,同时还有许多之前发布的模型。Gemma 3n 是一款支持文本、图像、视频和音频输入的多模态小语言模型。它还支持通过检索增强生成(RAG)进行微调和定制,以及使用新的 AI Edge SDK 进行函数调用。


Gemma 3n 提供两种参数变体,即 Gemma 3n 2BGemma 3n 4B,均支持文本和图像输入,音频支持在随后推出。与今年早些时候发布的非多模态 Gemma 3 1B 相比,新版本是一个显著的改进,Gemma 3 1B 仅需 529MB 即可在移动 GPU 上每秒处理多达 2585 个词元。


Gemma 3n 非常适合企业级应用场景,开发者可以充分利用设备的全部资源,从而在移动设备上运行更大的模型。例如,现场技术人员可以在没有网络服务的情况下拍摄零件照片并提问。仓库或厨房的工作人员可以在双手忙碌时通过语音更新库存。


谷歌表示,Gemma 3n 使用了选择性参数激活技术,这是一种高效的参数管理方法。这意味着这两个模型包含的参数数量比在推理期间激活的 2B 或 4B 参数要多。


谷歌强调,开发者可以对基础模型进行微调,然后使用 Google AI Edge 提供的新的量化工具对其进行转换和量化


在最新发布的量化工具中,新的量化方案大幅提升了 int4 后训练量化的质量。与 bf16(许多模型的默认数据类型)相比,int4 量化可将语言模型的大小缩小 2.5 到 4 倍,同时显著降低延迟和峰值内存消耗。


除了微调之外,这些模型还支持在设备上进行检索增强生成,能够将特定于应用程序的数据整合到语言模型中。目前,该功能由 Android 上的 AI Edge RAG 库提供支持,未来将拓展到更多平台。


RAG 库采用了一个简单的、包括几个步骤的流程:数据导入、分块和索引、嵌入生成、信息检索以及使用 LLM 生成响应。它支持对 RAG 流程进行全面定制,包括自定义数据库、分块策略和检索函数。


除了 Gemma 3n,谷歌还发布了目前仅在 Android 上可用的 AI Edge On-device Function Calling SDK,它能够让模型调用特定函数以执行实际的操作。


与纯粹生成文本不同,使用 FC SDK 可以让 LLM 生成结构化的函数调用,用于执行诸如搜索新信息、设置闹钟或预订等操作。


要将 LLM 与外部函数集成,需要指定函数的名称、描述(指导 LLM 何时使用该函数)以及所需的参数。这些元数据将被放置到一个 Tool 对象中,然后通过 GenerativeModel 构造函数传给大语言模型。函数调用 SDK 可以根据你提供的描述从 LLM 接收函数调用,并将执行结果反馈给 LLM。


如果你想深入了解这些新工具,可以参看 Google AI Edge Gallery,这是一个实验性应用程序,展示了各种模型,并支持文本、图像和音频处理。


原文链接

https://www.infoq.com/news/2025/05/gemma-3n-on-device-inference/

2025-06-02 10:005666

评论

发布
暂无评论

基于SpringBoot实现操作GaussDB(DWS)的项目实战

华为云开发者联盟

数据库 后端 华为云 企业号 2 月 PK 榜 华为云开发者联盟

IoT 物联网平台如何实现 100万/秒 消息广播?——实践类

阿里云AIoT

小程序 监控 物联网 传感器 测试技术

CodeArts Repo:6大特性助力企业代码稳定可靠安全无忧

华为云开发者联盟

云计算 后端 华为云 企业号 2 月 PK 榜 华为云开发者联盟

如何有效的解决代码的圈复杂度

京东科技开发者

代码 计算 圈复杂度 点边计算

chatGPT接入微信公众号方法总结(纯聊技术)

特立独行的猫

微信 ChatGPT 公众号接入

A/B测试成为企业“新窗口”:增长盈利告别经验主义,数据科学才是未来

字节跳动数据平台

大数据 AB testing实战 企业号 2 月 PK 榜

第七周作业-王者荣耀商城异地多活架构设计

不爱学习的程序猿

PDF电子书下载 和 企业物联网实例 视频讲解——实践类

阿里云AIoT

运维 监控 物联网

天翼云推出爬虫管理,助力企业安全高效发展

极客天地

模块7作业

程序员小张

「架构实战营」

瓴羊Quick BI提供移动端自助分析整体解决方案,Fine BI、Smart BI何时赶上?

小偏执o

接地电阻要小于4Ω,你知道是为什么吗?

元器件秋姐

科普 元器件 电阻 接地电阻

如何将Excel文档转换为PDF文档

Geek_249eec

Java Excel PDF

MQTT 5.0介绍

EMQ映云科技

性能 物联网 IoT mqtt 企业号 2 月 PK 榜

Python基础练习题(一)

漫步桔田

脑洞|ChatGPT加持下,ChatOps将如何革新团队协作与运维管理?

极狐GitLab

团队管理 DevOps 团队协作 ChatOps ChatGPT

Zebec生态持续深度布局,ZBC通证月内翻倍或只是开始

鳄鱼视界

Java单元测试浅析(JUnit+Mockito)

京东科技开发者

Java 单元测试 代码 JUnit Mockito

被骂惨了!复旦版「MOSS」服务器挤崩,一口吃不成ChatGPT

引迈信息

人工智能 AI ChatGPT MOSS

研发效能DevOps推荐书单

laofo

DevOps cicd 研发效能 持续交付

F5 分布式云服务为软银集团的私有基础设施带来云原生能力

F5 Inc

有奖调研!第五期(2022-2023)传统行业云原生技术落地调研——金融篇

York

容器 微服务 云原生 问卷调研

DevEco Studio端云协同开发之云数据库

白晓明

云数据库 HarmonyOS 端云协同

宣布 Databricks 支持 Amazon Graviton2,性价比提高3倍

亚马逊云科技 (Amazon Web Services)

数据库 存储

2023“Java基础-中级-高级”面试集结,已奉上我的膝盖

程序知音

Java java面试 金三银四 后端技术 Java面试八股文

数据治理如何做?火山引擎DataLeap帮助这款产品3个月降低计算成本20%

字节跳动数据平台

大数据 数据治理 数据研发 企业号 2 月 PK 榜

MQTT协议Keep Alive详解

EMQ映云科技

物联网 IoT mqtt 企业号 2 月 PK 榜 半连接

NFTScan x TiDB丨一栈式 HTAP 数据库为 Web3 数据服务提供毫秒级多维查询

NFT Research

数据库 NFT

任务管理-轻松搞定 IoT 设备重启、资源包更新、固件升级等业务——实践类

阿里云AIoT

json 物联网 数据格式

有没有夫妻相?刷一下脸就知道!

华为云开发者联盟

人工智能 华为云 企业号 2 月 PK 榜 华为云开发者联盟

谷歌发布Gemma 3n预览版和设备函数调用SDK_Google_InfoQ精选文章