阿里云ODPS普惠算力再升级,Data+AI全产品降价低至59元! 了解详情
写点什么

状态空间模型可以在低功耗边缘计算中实现 AI

作者:Patrick Farry

  • 2025-07-25
    北京
  • 本文字数:947 字

    阅读完需:约 3 分钟

大小:463.16K时长:02:38
状态空间模型可以在低功耗边缘计算中实现AI

在 2025 年 5 月于加州圣克拉拉举行的 2025 嵌入式视觉峰会上,BrainChip 的首席技术官 Tony Lewis展示了他的公司对状态空间模型(State Space ModelsSSMs)所做的研究,以及它们如何在功耗极低的有限计算环境中提供大语言模型(LLM)能力,例如在行车记录仪、医疗设备、安全摄像头甚至玩具等环境上。他展示了一个使用SSM架构的BrainChip TENN 1B LLM的例子

 

SSMs 的核心目标之一是绕过基于 Transformer 模型固有的上下文处理限制。他们通过利用矩阵来根据最后看到的词元(token)生成输出,这意味着过程中的所有历史都可以用当前状态来表示,这称为马尔可夫属性。相比之下,Transformer 模型需要访问前面存储在上下文中的每个词元。

 

由于状态空间模型没有记忆的特性,它们可以解决在低功耗计算环境中出现的许多约束,包括更好地利用 CPU 缓存和减少内存分页,这些都会影响设备功耗并增加成本。它们还可以使用较慢的只读存储器来存储模型参数和状态。

 

BrainChip 开发了自己的模型,称为TENNTemporal Event-Based Neural Network,基于时间的事件神经网络),目前是一个具有 10 亿参数的模型,有 24 个 SSM 层,可以在只读闪存上运行,功耗低于 0.5 瓦,同时能在 100 毫秒内返回结果。

 

Lewis 解释说,这些令人惊讶的指标是 TENN 模型的马尔可夫属性的结果,他说:“关于状态空间模型的一个很酷的事情是,实际使用的缓存非常小,所以在基于 Transformer 的模型中,你没有紧凑的状态,你必须要记住所有之前发生的事情的表示。”

 

此外,BrainChip 正在努力将模型量化为 4 位,以便它能够在边缘设备硬件上高效运行。

 

BrainChip 进行的基准测试显示,TENN 模型优于 Llama 3.2 1B,尽管 Lewis 警告说,TENN 模型的性能取决于特定应用程序,他建议使用 RAG 应用程序架构来防止幻觉。

 

SSMs 是一个活跃的研究领域,似乎在计算资源受限或高性能要求的地方特别有前途。它们独特的特性可以解锁新一代的边缘设备,使以前仅限于云端的复杂 AI 能力成为可能。有关 SSM 模型与 Transformer 模型性能比较的更多信息,请参阅 InfoQ 文章“幻觉的状态空间解决方案:状态空间模型如何在竞争中脱颖而出”。

 

可以在 Hugging Face 博客文章“状态空间模型(SSM)简介”中找到状态空间模型的技术概述以及它们的工作原理。

 

原文链接:

https://www.infoq.com/news/2025/07/state-space-models-edge-compute/

2025-07-25 14:001

评论

发布
暂无评论

演讲实录 | OpenMLDB 整合自动特征工程

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

专访 | 徐鹏程:开源,就是酷

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

OpenMLDB 实时引擎性能测试报告

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

裸辞不慌!入职蚂蚁金服P6,掌握并发编程我是这样吊打面试官的

钟奕礼

Java java面试 java编程 程序员‘

Ansible之Ansible Tower使用User和Team管理访问权限的笔记

山河已无恙

12月月更

Ansible之 AWX 管理清单和凭据的一些笔记

山河已无恙

12月月更

Ansible最佳实践之AWK VS Anssible Tower 界面介绍

山河已无恙

12月月更

Ansible最佳实践之 AWX 启用facts缓存和模板问卷调查

山河已无恙

12月月更

教育部公布2022年第一批产学合作协同育人项目,千锋教育57个项目成功立项

千锋IT教育

react源码中的协调与调度

flyzz177

React

OpenMLDB 社区月报 | 2022年10月

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

OpenMLDB v0.6 新版本运维功能增强

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

新变化新营销 这些知识点你得Get!(文末有PPT福利首次放送)

字节跳动数据平台

大数据 营销 12 月 PK 榜

关于 Git 重写历史的一些笔记

山河已无恙

12月月更

react源码分析:babel如何解析jsx

flyzz177

React

预告|2022 星策 Summit MLOps 分论坛议程公布!

星策开源社区

人工智能 机器学习 开源 AI MLOps

黄东旭:开发者的“技术无感化”时代,从 Serverless HTAP 数据库开始 | PingCAP DevCon 2022

PingCAP

TiDB

多引擎可视化数据流实现方案

元年技术洞察

数据中台 数字化转型 专利解析 方舟企业数字化 PaaS 平台 #方舟平台

Ansible最佳实践之 AWX 作业创建和启动

山河已无恙

12月月更

互联网医疗领域月度观察——数字乡村建设加快,“互联网+医疗健康”带动乡村高质量发展

易观分析

数字化 互联网医疗

创业者说丨云起无垠沈凯文:构建新一代开发安全基础设施 让Fuzzing技术为企业赋能

云起无垠

安全开发 开发安全 Fuzzing技术防护

SAP MM 为UB类型的STO执行VL10B,报错-没有项目类别表存在(表T184L NL 0002 V)-之对策

SAP虾客

SAP MM UB类型STO VL10B T184L

Ansible最佳实践之 AWX 构建高级作业工作流的创建和调度

山河已无恙

12月月更

react源码中的生命周期和事件系统

flyzz177

React

专访 | 罗成:开源并非“只可远观”

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

广西移动圆满完成区运会通信保障任务

极客天地

【python小脚本】监听日志文件异常数据发送告警短信

山河已无恙

12月月更

镕铭微电子加入龙蜥社区,推动开源 OS 在音视频产业的应用

OpenAnolis小助手

操作系统 芯片 数据存储 龙蜥社区 镕铭微电子

OpenMLDB Meetup No.7 回顾 | OpenMLDB+AutoX:整合自动特征工程,拥抱高效机器学习

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

教你用JavaScript实现乘法游戏

小院里的霍大侠

JavaScript 前端开发 编程实战 实战案例 初学者

Ansible最佳实践之Playbook高级循环任务如何操作

山河已无恙

12月月更

状态空间模型可以在低功耗边缘计算中实现AI_AI&大模型_InfoQ精选文章