智能体刷屏的背后,是 AI 应用拐点的来临?AICon 北京站议程重磅公布,50+ 硬核分享不容错过 了解详情
写点什么

谷歌发布 Gemma 3n 预览版和设备函数调用 SDK

作者:Steef-Jan Wiggers

  • 2025-06-02
    北京
  • 本文字数:1092 字

    阅读完需:约 4 分钟

大小:421.60K时长:02:23
谷歌发布Gemma 3n预览版和设备函数调用SDK

谷歌发布 Gemma 3n 预览版,可在新的 LiteRT Hugging Face 社区中找到,同时还有许多之前发布的模型。Gemma 3n 是一款支持文本、图像、视频和音频输入的多模态小语言模型。它还支持通过检索增强生成(RAG)进行微调和定制,以及使用新的 AI Edge SDK 进行函数调用。


Gemma 3n 提供两种参数变体,即 Gemma 3n 2BGemma 3n 4B,均支持文本和图像输入,音频支持在随后推出。与今年早些时候发布的非多模态 Gemma 3 1B 相比,新版本是一个显著的改进,Gemma 3 1B 仅需 529MB 即可在移动 GPU 上每秒处理多达 2585 个词元。


Gemma 3n 非常适合企业级应用场景,开发者可以充分利用设备的全部资源,从而在移动设备上运行更大的模型。例如,现场技术人员可以在没有网络服务的情况下拍摄零件照片并提问。仓库或厨房的工作人员可以在双手忙碌时通过语音更新库存。


谷歌表示,Gemma 3n 使用了选择性参数激活技术,这是一种高效的参数管理方法。这意味着这两个模型包含的参数数量比在推理期间激活的 2B 或 4B 参数要多。


谷歌强调,开发者可以对基础模型进行微调,然后使用 Google AI Edge 提供的新的量化工具对其进行转换和量化


在最新发布的量化工具中,新的量化方案大幅提升了 int4 后训练量化的质量。与 bf16(许多模型的默认数据类型)相比,int4 量化可将语言模型的大小缩小 2.5 到 4 倍,同时显著降低延迟和峰值内存消耗。


除了微调之外,这些模型还支持在设备上进行检索增强生成,能够将特定于应用程序的数据整合到语言模型中。目前,该功能由 Android 上的 AI Edge RAG 库提供支持,未来将拓展到更多平台。


RAG 库采用了一个简单的、包括几个步骤的流程:数据导入、分块和索引、嵌入生成、信息检索以及使用 LLM 生成响应。它支持对 RAG 流程进行全面定制,包括自定义数据库、分块策略和检索函数。


除了 Gemma 3n,谷歌还发布了目前仅在 Android 上可用的 AI Edge On-device Function Calling SDK,它能够让模型调用特定函数以执行实际的操作。


与纯粹生成文本不同,使用 FC SDK 可以让 LLM 生成结构化的函数调用,用于执行诸如搜索新信息、设置闹钟或预订等操作。


要将 LLM 与外部函数集成,需要指定函数的名称、描述(指导 LLM 何时使用该函数)以及所需的参数。这些元数据将被放置到一个 Tool 对象中,然后通过 GenerativeModel 构造函数传给大语言模型。函数调用 SDK 可以根据你提供的描述从 LLM 接收函数调用,并将执行结果反馈给 LLM。


如果你想深入了解这些新工具,可以参看 Google AI Edge Gallery,这是一个实验性应用程序,展示了各种模型,并支持文本、图像和音频处理。


原文链接

https://www.infoq.com/news/2025/05/gemma-3n-on-device-inference/

2025-06-02 10:001

评论

发布
暂无评论

并发王者课 - 青铜4:synchronized用法初体验

MetaThoughts

Java 多线程 并发 并发王者课

签了!百度智能云携手浙江广播电视集团共推媒体数智化转型

百度大脑

媒体 百度智能云

把数字人民币打造成全球最佳的央行数字货币

CECBC

金融

聊聊数据分析

数据社

数据分析 5月日更

华为推送踩坑记录

mengxn

Kubernetes 稳定性保障手册:洞察+预案

阿里巴巴云原生

数据库 容器 云原生 k8s 监控

绍兴柯桥淘宝美工培训到哪里?兴德

Geek_196d9f

绍兴柯桥室内设计培训到哪里?兴德

Geek_196d9f

绍兴柯桥电脑办公培训到哪里?兴德

Geek_196d9f

绍兴柯桥学历提升培训到哪里?兴德

Geek_196d9f

绍兴柯桥JAVA,web前端编程培训到哪里?兴德

Geek_196d9f

绍兴柯桥3Dmax效果图培训到哪里?兴德

Geek_196d9f

五种网络IO模型详解

Linux服务器开发

后端 epoll Linux服务器开发 网络io 网络模型

绍兴柯桥服装设计培训到哪里?兴德

Geek_196d9f

绍兴柯桥淘宝拼多多电商培训到哪里?兴德

Geek_196d9f

绍兴柯桥平面设计培训到哪里?兴德

Geek_196d9f

320万开发者在用的飞桨,全新发布推理部署导航图:打通AI应用最后一公里

百度大脑

人工智能 飞桨

5分钟速读之Rust权威指南(九)

wzx

rust

支持多套对象存储,冷热数据分层又添新功能

焱融科技

分布式 云原生 高性能 文件存储 技术博客

绍兴柯桥会计实操培训到哪里?兴德

Geek_196d9f

绍兴柯桥数码印花金昌描稿调色分色培训到哪里?兴德

Geek_196d9f

绍兴柯桥插花花艺培训到哪里?兴德

Geek_196d9f

Bzz算力挖矿系统开发节点部署

薇電13242772558

数字货币 算力

python 常用模块详解

若尘

模块 Python编程 5月日更

绍兴柯桥PS培训到哪里?怎么修图?兴德

Geek_196d9f

绍兴柯桥CAD制图培训到哪里?兴德!

Geek_196d9f

人生算法:内控控制点

石云升

读书笔记 思维模型 5月日更

绍兴柯桥摄影摄像培训到哪里?兴德!

Geek_196d9f

绍兴柯桥视频剪辑影视后期PR,AE培训到哪里?兴德

Geek_196d9f

微服务注册中心:Consul——概念与基础操作

程序员架构进阶

微服务 Consul 注册中心 28天写作 5月日更

“丝绸之舟”创新区块链帮扶模式

CECBC

区块链 丝路

谷歌发布Gemma 3n预览版和设备函数调用SDK_Google_InfoQ精选文章