50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

状态空间模型可以在低功耗边缘计算中实现 AI

作者:Patrick Farry

  • 2025-07-25
    北京
  • 本文字数:947 字

    阅读完需:约 3 分钟

大小:463.16K时长:02:38
状态空间模型可以在低功耗边缘计算中实现AI

在 2025 年 5 月于加州圣克拉拉举行的 2025 嵌入式视觉峰会上,BrainChip 的首席技术官 Tony Lewis展示了他的公司对状态空间模型(State Space ModelsSSMs)所做的研究,以及它们如何在功耗极低的有限计算环境中提供大语言模型(LLM)能力,例如在行车记录仪、医疗设备、安全摄像头甚至玩具等环境上。他展示了一个使用SSM架构的BrainChip TENN 1B LLM的例子

 

SSMs 的核心目标之一是绕过基于 Transformer 模型固有的上下文处理限制。他们通过利用矩阵来根据最后看到的词元(token)生成输出,这意味着过程中的所有历史都可以用当前状态来表示,这称为马尔可夫属性。相比之下,Transformer 模型需要访问前面存储在上下文中的每个词元。

 

由于状态空间模型没有记忆的特性,它们可以解决在低功耗计算环境中出现的许多约束,包括更好地利用 CPU 缓存和减少内存分页,这些都会影响设备功耗并增加成本。它们还可以使用较慢的只读存储器来存储模型参数和状态。

 

BrainChip 开发了自己的模型,称为TENNTemporal Event-Based Neural Network,基于时间的事件神经网络),目前是一个具有 10 亿参数的模型,有 24 个 SSM 层,可以在只读闪存上运行,功耗低于 0.5 瓦,同时能在 100 毫秒内返回结果。

 

Lewis 解释说,这些令人惊讶的指标是 TENN 模型的马尔可夫属性的结果,他说:“关于状态空间模型的一个很酷的事情是,实际使用的缓存非常小,所以在基于 Transformer 的模型中,你没有紧凑的状态,你必须要记住所有之前发生的事情的表示。”

 

此外,BrainChip 正在努力将模型量化为 4 位,以便它能够在边缘设备硬件上高效运行。

 

BrainChip 进行的基准测试显示,TENN 模型优于 Llama 3.2 1B,尽管 Lewis 警告说,TENN 模型的性能取决于特定应用程序,他建议使用 RAG 应用程序架构来防止幻觉。

 

SSMs 是一个活跃的研究领域,似乎在计算资源受限或高性能要求的地方特别有前途。它们独特的特性可以解锁新一代的边缘设备,使以前仅限于云端的复杂 AI 能力成为可能。有关 SSM 模型与 Transformer 模型性能比较的更多信息,请参阅 InfoQ 文章“幻觉的状态空间解决方案:状态空间模型如何在竞争中脱颖而出”。

 

可以在 Hugging Face 博客文章“状态空间模型(SSM)简介”中找到状态空间模型的技术概述以及它们的工作原理。

 

原文链接:

https://www.infoq.com/news/2025/07/state-space-models-edge-compute/

2025-07-25 14:005475

评论

发布
暂无评论

软件测试|pyecharts绘制NBA球星得分能力对比图

霍格沃兹测试开发学社

帮您了解CDN节点如何做到访问加速与安全防护

天翼云开发者社区

云计算 CDN 内容分发网络

软件测试|教你轻松解决pip安装下载超时问题

霍格沃兹测试开发学社

请解释如何实现算法 PERMUTE-BY-SORTING,以处理两个或更多优先级相同的情形。也就是说,即使有两个或更多优先级相同,你的算法也应该产生一个均匀随机排列。

福大大架构师每日一题

福大大 ChatGPT

推动高校教改:如何面向人文社科教授数据分析

ModelWhale

数据分析 学科交叉 人文社科 教学经验 高等教育

软件测试|Python操作Excel制作报表,不要太方便

霍格沃兹测试开发学社

2023-06-09:什么是Redis事务?原理是什么?

福大大架构师每日一题

redis 福大大

关于GDPR体系文件介绍,介绍GDPR体系文件的内容和意义

镭速

镭速用心打造,新版本发布,为用户实现更多可能

镭速

潮流地标美罗城焕新活力,智图赋能传统商业经典延续|MobTech观察

MobTech袤博科技

头部大模型公司进京赶考,向量数据库成为应考神器

Zilliz

Milvus Zilliz AIGC 向量数据库 zillizcloud

索信达携手华为联合发布智能营销标签平台解决方案

索信达控股

软件测试|Python绘图神器——Matplotlib使用教程(一)

霍格沃兹测试开发学社

C语言编程—强制类型转换

芯动大师

C语言 强制类型转换 6 月 优质更文活动

虚拟机安装Ubuntu16并安装Ros(Kinetic)

Studying_swz

6 月 优质更文活动

一文快速了解微服务架构

穿过生命散发芬芳

微服务 6 月 优质更文活动

Nop平台为什么是一个独一无二的开源软件开发平台

canonical

开源 低代码 开发平台

软件测试|码农必会的git操作(一)

霍格沃兹测试开发学社

什么是无服务器架构技术?

天翼云开发者社区

服务器 架构设计

基于 AIGC,RocketMQ 学习社区探索开源软件学习新范式

阿里巴巴云原生

阿里云 RocketMQ 云原生 AIGC

软件测试|必须遵循的UI自动化设计军规

霍格沃兹测试开发学社

软件测试|一文教你flask路由配置

霍格沃兹测试开发学社

STM32读取BH1750光照强度数据打印到串口

DS小龙哥

6 月 优质更文活动

AIGC时代,基于云原生 MLOps 构建属于你的大模型(上)

York

云原生 大模型 MLOps AIGC ChatGPT

边缘计算简介

天翼云开发者社区

云计算 边缘计算

2024深圳电子展

AIOTE智博会

电子展

解密云商降本之谜:揭开AWS账单的真相,实现Finops的关键数据

jinjin

AWS 降本增效 spotmax FinOps 节约成本

软件测试|一文带你了解Flask框架

霍格沃兹测试开发学社

状态空间模型可以在低功耗边缘计算中实现AI_AI&大模型_InfoQ精选文章