大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

谷歌发布新版 LiteRT,增强设备机器学习推理能力

  • 2025-05-31
    北京
  • 本文字数:918 字

    阅读完需:约 3 分钟

大小:470.54K时长:02:40
谷歌发布新版LiteRT,增强设备机器学习推理能力

LiteRT(之前的 TensorFlow Lite)新版本已发布,引入了一个新的 API 来简化设备上的机器学习推理,提升 GPU 加速性能,支持高通 NPU(神经处理单元)加速器,并增加了高级推理功能。


新版本 LiteRT 的一个目标是让开发者可以更容易地利用 GPU 和 NPU 加速,这在之前开发者需要使用特定的 API 或供应商特定的 SDK:


在移动 GPU 和 NPU 上加速 AI 模型,可以将模型的速度提高到 CPU 的 25 倍,同时将功耗降低到原来的五分之一。


LiteRT 正对 GPU 引入了 MLDrift,一种新的 GPU 加速实现,与 TFLite 的 GPU 委托相比,它带来了几项改进:包括更高效的基于张量的数据组织、基于上下文和资源的智能计算,以及优化的数据传输和转换。


这使得其性能显著优于 CPU,优于之前版本的 TFLite GPU 委托,甚至优于其他支持 GPU 的框架,尤其是在 CNN 和 Transformer 模型方面。


LiteRT 还针对神经处理单元(NPU)进行了优化,NPU 是专门用于加速推理的 AI 加速器。根据谷歌的内部基准测试,NPU 的性能可以达到 CPU 的 25 倍,同时仅消耗五分之一的电量。然而,目前并没有一种标准化的方式来整合这些加速器,通常需要使用定制的 SDK 和供应商特定的依赖项。


因此,为了提供一种统一的 NPU 开发和部署模型的方式,谷歌与高通和联发科合作,在 LiteRT 中增加了对它们的 NPU 支持,从而能够加速视觉、音频和自然语言处理模型。这包括在安装 LiteRT 时自动下载 SDK,以及通过 Google Play 选择性地分发模型和运行时。


此外,为了进一步简化 GPU 和 NPU 加速的处理过程,谷歌对 LiteRT 的 API 进行了简化,让开发者在创建编译模型时能够指定要使用的后端。这可以通过 CompiledModel::Create 方法来实现,该方法支持 CPU、XNNPack、GPU、NNAPI(用于 NPU)和 EdgeTPU 后端,与之前需要针对每个后端使用不同方法的版本相比,大大简化了流程。


LiteRT API 还引入了一些优化推理性能的功能,尤其针对内存或处理器受限的环境。这些功能包括通过新的 TensorBuffer API 实现的缓冲区互操作性,该 API消除了GPU内存和CPU内存之间的数据复制;以及支持在 CPU、GPU 和 NPU 之间异步、并发地执行模型的不同部分。据谷歌透露,这可以将延迟降低到原来的一半。


LiteRT 可以从GitHub下载,其中包含了几个示例应用程序,演示如何使用它。


原文链接

https://www.infoq.com/news/2025/05/google-litert-on-device-ai/

2025-05-31 14:006083

评论

发布
暂无评论

特别评论:甲骨文的傲气

张晓楠

云计算 互联网巨头 企业文化

用你喜欢的 emoji 作为页面的 favicon 吧 🎉

遇见

CSS html favicon emoji

无代码开发

Fenng

一篇文章搞定 java 中的 path 和 classpath

shengjk1

Java classpath vs path classpath path

探究vscode debug流程,解决无法运行go程序的问题

simpleapples

vscode Go 语言

GitHub知错就改,是个好同志

遇见

GitHub

简单到不可能失败 —— 《微习惯》

零和幺

读书笔记

如何解决 Kubernetes 的 DNS 延迟问题

倪朋飞

Kubernetes 微服务 云原生

我如何用 Python 给 Github 的 README.md 做一个访客统计功能

遇见

Python GitHub 开源 badge open-source

做小池塘里的大鱼,还是大池塘里的小鱼?这是个问题。

霍太稳@极客邦科技

创业 团队管理 目标管理

喔,明白了,成功也是一种苦难

霍太稳@极客邦科技

创业 身心健康 企业文化 个人成长 心理

我的第一个千万阅读量

彭宏豪95

创作 生活 写作

Elasticsearch文档版本冲突原理与解决

Skysper

elasticsearch 乐观锁 悲观锁

HTTP Methods和RESTful API的设计

孙苏勇

架构 系统设计 RESTful 接口

分布式数据库是无用的屠龙术吗?

海边的Ivan

企业架构 分布式数据库 业务中台

精纯还是混乱?职场十二箴言——重读“成为乔布斯”的思考(二)

石君

创业 乔布斯 成为乔布斯

任正非管理哲学中的三个常识和三种科学

霍太稳@极客邦科技

创业 团队管理 华为

【SpringBoot】掌握这两个属性,你的测试类可以启动的更快些

遇见

Java Spring Boot Unit Test

Kubernetes 容器运行时演进

倪朋飞

Kubernetes 容器 云原生

是时候要说再见了,春风十里,不如邮你!

乐少

dubbo-go 中如何实现远程配置管理

joe

Apache 开源 微服务 dubbo Go 语言

Kubernetes中的CI/CD

倪朋飞

Kubernetes DevOps 微服务

如何做一名失败的安全架构师

石君

架构 安全架构师 安全评估

精纯还是混乱?职场十二箴言——重读“成为乔布斯”的思考(一)

石君

职场 乔布斯 成功学

删掉最后一句话

池建强

心理学 情绪控制

《小狗钱钱》——财富离我们并不遥远

Yin

读书笔记 投资 成长 思维方式

走出舒适区最好办法别走了,扩大它

乐少

翻译: Effective Go (2)

申屠鹏会

翻译 Go 语言

小议RPA

一品凡心

人工智能 RPA 自动化

【深度】为您解读东西方艺术教育的专业设置差异对比~

默聲

做产品的同理心

孙苏勇

产品 产品经理 产品设计

谷歌发布新版LiteRT,增强设备机器学习推理能力_AI&大模型_Sergio De Simone_InfoQ精选文章