10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

谷歌发布新版 LiteRT,增强设备机器学习推理能力

  • 2025-05-31
    北京
  • 本文字数:918 字

    阅读完需:约 3 分钟

大小:470.54K时长:02:40
谷歌发布新版LiteRT,增强设备机器学习推理能力

LiteRT(之前的 TensorFlow Lite)新版本已发布,引入了一个新的 API 来简化设备上的机器学习推理,提升 GPU 加速性能,支持高通 NPU(神经处理单元)加速器,并增加了高级推理功能。


新版本 LiteRT 的一个目标是让开发者可以更容易地利用 GPU 和 NPU 加速,这在之前开发者需要使用特定的 API 或供应商特定的 SDK:


在移动 GPU 和 NPU 上加速 AI 模型,可以将模型的速度提高到 CPU 的 25 倍,同时将功耗降低到原来的五分之一。


LiteRT 正对 GPU 引入了 MLDrift,一种新的 GPU 加速实现,与 TFLite 的 GPU 委托相比,它带来了几项改进:包括更高效的基于张量的数据组织、基于上下文和资源的智能计算,以及优化的数据传输和转换。


这使得其性能显著优于 CPU,优于之前版本的 TFLite GPU 委托,甚至优于其他支持 GPU 的框架,尤其是在 CNN 和 Transformer 模型方面。


LiteRT 还针对神经处理单元(NPU)进行了优化,NPU 是专门用于加速推理的 AI 加速器。根据谷歌的内部基准测试,NPU 的性能可以达到 CPU 的 25 倍,同时仅消耗五分之一的电量。然而,目前并没有一种标准化的方式来整合这些加速器,通常需要使用定制的 SDK 和供应商特定的依赖项。


因此,为了提供一种统一的 NPU 开发和部署模型的方式,谷歌与高通和联发科合作,在 LiteRT 中增加了对它们的 NPU 支持,从而能够加速视觉、音频和自然语言处理模型。这包括在安装 LiteRT 时自动下载 SDK,以及通过 Google Play 选择性地分发模型和运行时。


此外,为了进一步简化 GPU 和 NPU 加速的处理过程,谷歌对 LiteRT 的 API 进行了简化,让开发者在创建编译模型时能够指定要使用的后端。这可以通过 CompiledModel::Create 方法来实现,该方法支持 CPU、XNNPack、GPU、NNAPI(用于 NPU)和 EdgeTPU 后端,与之前需要针对每个后端使用不同方法的版本相比,大大简化了流程。


LiteRT API 还引入了一些优化推理性能的功能,尤其针对内存或处理器受限的环境。这些功能包括通过新的 TensorBuffer API 实现的缓冲区互操作性,该 API消除了GPU内存和CPU内存之间的数据复制;以及支持在 CPU、GPU 和 NPU 之间异步、并发地执行模型的不同部分。据谷歌透露,这可以将延迟降低到原来的一半。


LiteRT 可以从GitHub下载,其中包含了几个示例应用程序,演示如何使用它。


原文链接

https://www.infoq.com/news/2025/05/google-litert-on-device-ai/

2025-05-31 14:006191

评论

发布
暂无评论

深入nodejs的event-loop

coder2028

JavaScript 前端

彻底搞懂nodejs事件循环

coder2028

JavaScript 前端

LeetCode题解:137. 只出现一次的数字 II,哈希表,JavaScript,详细注释

Lee Chen

JavaScript LeetCode

【记】滑动拼图验证码在搜索中的作用

宙哈哈

Python html 验证码

2023秋招前端面试必会的面试题

Geek_02d948

JavaScript 前端

拿到大厂前端offer的前端开发是怎么回答面试题的

hellocoder2029

JavaScript 前端

协同存储,为边缘计算创造更大价值

阿里云CloudImagine

云计算 边缘计算

《三体》问题

蓬蒿

CPU 寄存器 延时

前端经典面试题(有答案)

coder2028

JavaScript 前端

你需要知道的webpack高频面试题

Geek_02d948

JavaScript 前端

Nautilus Chain 现已推出测试网“Triton ”,有哪些潜在的机会?

西柚子

基于rsync实现海量文件高速传输的解决方案

镭速

21天吃透这套字节面试题后,我成功跳槽进了字节,税后25K

Java 数据结构 面试 算法

2023秋招前端面试必会的面试题

coder2028

JavaScript 前端

一文彻底搞懂前端缓存机制

hellocoder2029

JavaScript 前端

通过微信小程序体验阿里云IoT物联网平台——设备接入类

阿里云AIoT

物联网

NCCL源码解析①:初始化及ncclUniqueId的产生

OneFlow

人工智能 深度学习

3.15 数据库吐槽大会

NineData

数据库 mongodb 云计算 程序员 图数据库

认识一下,我们是应用社交「幕后大佬」 IM 家族

融云 RongCloud

即时通讯 IM

ArkUI中的线程和看门狗机制

OpenHarmony开发者

OpenHarmony

SpringBoot中事件与通知

石臻臻的杂货铺

spring springboot

一文读懂Js中的this指向

hellocoder2029

JavaScript 前端

如何评估某活动带来的大盘增量 | 得物技术

得物技术

AI 数据

【小程序案例】支付宝小程序-MQTT模器,IoT设备通过WSS接入阿里云IoT物联网平台——设备接入类

阿里云AIoT

JavaScript windows 物联网

行云管家堡垒机客服电话是多少?谁知道?

行云管家

网络安全 数据安全 堡垒机 行云管家

前端常考面试题整理

hellocoder2029

JavaScript 前端

前端常考vue面试题(必备)

yyds2026

Vue 前端

vue实战中的一些小技巧

yyds2026

Vue 前端

一文彻底读懂webpack常用配置

Geek_02d948

JavaScript 前端

深圳高新技术企业申请条件以及流程简单说明

行云管家

高新企业 高新技术 高新

美团前端高频面试题集锦

Geek_02d948

JavaScript 前端

谷歌发布新版LiteRT,增强设备机器学习推理能力_AI&大模型_Sergio De Simone_InfoQ精选文章