写点什么

谷歌发布新版 LiteRT,增强设备机器学习推理能力

  • 2025-05-31
    北京
  • 本文字数:918 字

    阅读完需:约 3 分钟

大小:470.54K时长:02:40
谷歌发布新版LiteRT,增强设备机器学习推理能力

LiteRT(之前的 TensorFlow Lite)新版本已发布,引入了一个新的 API 来简化设备上的机器学习推理,提升 GPU 加速性能,支持高通 NPU(神经处理单元)加速器,并增加了高级推理功能。


新版本 LiteRT 的一个目标是让开发者可以更容易地利用 GPU 和 NPU 加速,这在之前开发者需要使用特定的 API 或供应商特定的 SDK:


在移动 GPU 和 NPU 上加速 AI 模型,可以将模型的速度提高到 CPU 的 25 倍,同时将功耗降低到原来的五分之一。


LiteRT 正对 GPU 引入了 MLDrift,一种新的 GPU 加速实现,与 TFLite 的 GPU 委托相比,它带来了几项改进:包括更高效的基于张量的数据组织、基于上下文和资源的智能计算,以及优化的数据传输和转换。


这使得其性能显著优于 CPU,优于之前版本的 TFLite GPU 委托,甚至优于其他支持 GPU 的框架,尤其是在 CNN 和 Transformer 模型方面。


LiteRT 还针对神经处理单元(NPU)进行了优化,NPU 是专门用于加速推理的 AI 加速器。根据谷歌的内部基准测试,NPU 的性能可以达到 CPU 的 25 倍,同时仅消耗五分之一的电量。然而,目前并没有一种标准化的方式来整合这些加速器,通常需要使用定制的 SDK 和供应商特定的依赖项。


因此,为了提供一种统一的 NPU 开发和部署模型的方式,谷歌与高通和联发科合作,在 LiteRT 中增加了对它们的 NPU 支持,从而能够加速视觉、音频和自然语言处理模型。这包括在安装 LiteRT 时自动下载 SDK,以及通过 Google Play 选择性地分发模型和运行时。


此外,为了进一步简化 GPU 和 NPU 加速的处理过程,谷歌对 LiteRT 的 API 进行了简化,让开发者在创建编译模型时能够指定要使用的后端。这可以通过 CompiledModel::Create 方法来实现,该方法支持 CPU、XNNPack、GPU、NNAPI(用于 NPU)和 EdgeTPU 后端,与之前需要针对每个后端使用不同方法的版本相比,大大简化了流程。


LiteRT API 还引入了一些优化推理性能的功能,尤其针对内存或处理器受限的环境。这些功能包括通过新的 TensorBuffer API 实现的缓冲区互操作性,该 API消除了GPU内存和CPU内存之间的数据复制;以及支持在 CPU、GPU 和 NPU 之间异步、并发地执行模型的不同部分。据谷歌透露,这可以将延迟降低到原来的一半。


LiteRT 可以从GitHub下载,其中包含了几个示例应用程序,演示如何使用它。


原文链接

https://www.infoq.com/news/2025/05/google-litert-on-device-ai/

2025-05-31 14:001

评论

发布
暂无评论

TypeScript Module

程序员海军

三周年连更

缓存的处理步骤

阿泽🧸

缓存 三周年连更

Matlab实现光伏发电电池模型

Shine

三周年连更

活动回顾|微服务x容器开源开发者 Meetup 成都站回放 & PPT 下载

阿里巴巴云原生

阿里云 开源 容器 微服务 云原生

预训练对话大模型深度解读

轻口味

AI 大模型 三周年连更

Django笔记十五之in查询及date日期相关过滤操作

Hunter熊

Python django 日期

重构这件“小”事儿 | 得物技术

得物技术

【深入浅出Spring原理及实战】「源码调试分析」深入源码探索Spring底层框架的的refresh方法所出现的问题和异常

码界西柚

spring NPE 源码剖析 4月日更 问题分析

新手如何学好Zbrush3D建模?

Finovy Cloud

3D软件

百度平地起“雷”,突然爆出的QPS数据意味着什么?

脑极体

大模型

如何使用 Java 将 JSON 文件读取为字符串?这三种方法很管用!

Java架构历程

三周年连更

Cloud Kernel SIG月度动态:发布 Anolis 8.8 镜像、kABI 社区共建流程

OpenAnolis小助手

镜像 龙蜥社区 sig kernel 月报

各行业常见的业务指标汇总(数据分析常用数据指标)

Data 探险实验室

数据分析 数据分析师 数据指标 指标中台; 数据分析 指标洞察

使用 Kubectl Patch 命令更新资源

Se7en

云原生

CnosDB成为首个支持sqllogictest的时序数据库,稳定性与可靠性再升级

CnosDB

数据库 开源 时序数据库 CnosDB

【Python实战】Python对中国500强排行榜数据进行可视化分析

BROKEN

三周年连更

【已结束】直播预告|传统 PvE 游戏 ∕ 开房间 PvP 游戏的云原生架构升级

阿里巴巴云原生

阿里云 云原生 游戏

算法刷题-移除元素、分数到小数、整数转罗马数字

共饮一杯无

数据结构 算法 三周年连更

ChatGPT辅助编写自动化测试

QE_LAB

单元测试 自动化测试 接口测试 测试技术 ChatGPT

今天,飞桨公众号六岁啦!

飞桨PaddlePaddle

飞桨PaddlePaddle

数字未来:世界正走向新的“破茧时刻”

脑极体

华为

学会 Go select 语句,轻松实现高效并发

陈明勇

Go golang 高并发 select 三周年连更

当⻉借⼒阿⾥云落地云原⽣架构转型,运维降本、效率稳定性双升

阿里巴巴云原生

阿里云 云原生 云原生架构

2023年3月用户体验GX评测:国有行及股份行持续领跑,城商行及农商行农信社积极探索实践用户体验体系搭建

易观分析

金融 银行

音视频八股文(4)--ffmpeg常见命令(3)

福大大架构师每日一题

音视频 ffmpeg

关于容器云的三种网络设计

穿过生命散发芬芳

容器云 三周年连更

2022-04-23:给定你一个整数数组 nums 我们要将 nums 数组中的每个元素移动到 A 集合 或者 B 集合中 使得 A 集合和 B 集合不为空,并且 average(A) == aver

福大大架构师每日一题

golang 算法 rust

测试需求平台8-Arco组件实现产品增改需求

MegaQi

测试平台开发 三周年连更 AcroVue

Docgeni 2.1 正式发布

PingCode研发中心

软件开发 Docgeni

基于 Amazon SageMaker 构建细粒度情感分析应用

亚马逊云科技 (Amazon Web Services)

机器学习 Amazon SageMaker

世界读书日|华为阅读联合40余家伙伴推出精品书单

最新动态

谷歌发布新版LiteRT,增强设备机器学习推理能力_AI&大模型_Sergio De Simone_InfoQ精选文章