写点什么

状态空间模型可以在低功耗边缘计算中实现 AI

作者:Patrick Farry

  • 2025-07-25
    北京
  • 本文字数:947 字

    阅读完需:约 3 分钟

大小:463.16K时长:02:38
状态空间模型可以在低功耗边缘计算中实现AI

在 2025 年 5 月于加州圣克拉拉举行的 2025 嵌入式视觉峰会上,BrainChip 的首席技术官 Tony Lewis展示了他的公司对状态空间模型(State Space ModelsSSMs)所做的研究,以及它们如何在功耗极低的有限计算环境中提供大语言模型(LLM)能力,例如在行车记录仪、医疗设备、安全摄像头甚至玩具等环境上。他展示了一个使用SSM架构的BrainChip TENN 1B LLM的例子

 

SSMs 的核心目标之一是绕过基于 Transformer 模型固有的上下文处理限制。他们通过利用矩阵来根据最后看到的词元(token)生成输出,这意味着过程中的所有历史都可以用当前状态来表示,这称为马尔可夫属性。相比之下,Transformer 模型需要访问前面存储在上下文中的每个词元。

 

由于状态空间模型没有记忆的特性,它们可以解决在低功耗计算环境中出现的许多约束,包括更好地利用 CPU 缓存和减少内存分页,这些都会影响设备功耗并增加成本。它们还可以使用较慢的只读存储器来存储模型参数和状态。

 

BrainChip 开发了自己的模型,称为TENNTemporal Event-Based Neural Network,基于时间的事件神经网络),目前是一个具有 10 亿参数的模型,有 24 个 SSM 层,可以在只读闪存上运行,功耗低于 0.5 瓦,同时能在 100 毫秒内返回结果。

 

Lewis 解释说,这些令人惊讶的指标是 TENN 模型的马尔可夫属性的结果,他说:“关于状态空间模型的一个很酷的事情是,实际使用的缓存非常小,所以在基于 Transformer 的模型中,你没有紧凑的状态,你必须要记住所有之前发生的事情的表示。”

 

此外,BrainChip 正在努力将模型量化为 4 位,以便它能够在边缘设备硬件上高效运行。

 

BrainChip 进行的基准测试显示,TENN 模型优于 Llama 3.2 1B,尽管 Lewis 警告说,TENN 模型的性能取决于特定应用程序,他建议使用 RAG 应用程序架构来防止幻觉。

 

SSMs 是一个活跃的研究领域,似乎在计算资源受限或高性能要求的地方特别有前途。它们独特的特性可以解锁新一代的边缘设备,使以前仅限于云端的复杂 AI 能力成为可能。有关 SSM 模型与 Transformer 模型性能比较的更多信息,请参阅 InfoQ 文章“幻觉的状态空间解决方案:状态空间模型如何在竞争中脱颖而出”。

 

可以在 Hugging Face 博客文章“状态空间模型(SSM)简介”中找到状态空间模型的技术概述以及它们的工作原理。

 

原文链接:

https://www.infoq.com/news/2025/07/state-space-models-edge-compute/

2025-07-25 14:005381

评论

发布
暂无评论

技术向上,场景向下丨华为云828 B2B企业节打通云上路径

轶天下事

降维算法了解一下

小魏写代码

利用ChatGPT,SQL数据分析学习效率翻倍

百度开发者中心

#人工智能 ChatGPT SQL Server

基于Java开发的数字采购系统(供应商、询价、招标、订单送货)

金陵老街

华为云盘古大模型for医学,“良医小慧”让智慧诊疗触手可及

彭飞

OpenHarmony装饰指定自定义组件:@BuilderParam装饰器

OpenHarmony开发者

OpenHarmony

基于Prompt和迁移学习的文本分类优化

百度开发者中心

自然语言处理 #人工智能

一键登录是如何为应用开发者实现降本增效的

MobTech袤博科技

大数据 智能推送

轻量应用服务器选哪家?华为云耀云服务器L实例告诉你如何选择

轶天下事

轻量应用服务器价值典范,云耀云服务器助力企业穿越经济周期

轶天下事

解析Prompt自然语言处理的关键因素

百度开发者中心

#人工智能 ChatGPT Prompt 千帆大模型平台

王文京受邀在财政部“会计大讲堂”做信息技术驱动当代会计创新发展的专题报告

用友BIP

智能会计

Mac Office安装许可工具后,软件显示只读模式,如何解决?

展初云

Office Mac软件

运行Adobe应用提示非正版This non-genuine Adobe app has been disabled如何处理

展初云

ps adobe Mac软件

在AI的风口上,百度营销如何助力企业抢占先机?

彭飞

在 Kubernetes 环境中实现证书管理的自动化

NGINX开源社区

nginx Kubernetes 证书管理

软件开发、管理全周期文档整理,满足开发、验收、投标支撑

金陵老街

工作流如何实现?集成?springboot+vue+activiti技术栈

金陵老街

使用ChatGPT快速构建优质网站模板的方法

百度开发者中心

#人工智能 ChatGPT 千帆大模型平台

从繁琐到一键直达:秒验助力实现优化用户登录体验

MobTech袤博科技

大数据 智能推送

华为云耀云服务器 L 实例:为你揭开轻量应用服务器的神秘面纱

轶天下事

中小企业请收藏丨轻量应用服务器企业选购避坑指南

轶天下事

K-最近邻算法(KNN)

小魏写代码

遥遥领先的不仅是华为Mate60 Pro+,华为云正在数字赋能万千中小企业

轶天下事

打造承载百倍级增长后台背后的力量

优测云服务平台

性能优化 后台开发 性能测试 压力测试 性能压测

征稿啦!第 18 届「中国 Linux 内核开发者大会」重磅启动

OpenAnolis小助手

Linux 开发者 内核 龙蜥社区 CLK

游戏服务商Latis Global参展2023 ChinaJoy B2B

科技热闻

聚焦私域营销降本提效,国联股份与火山引擎数智平台展开合作

字节跳动数据平台

大数据 数字化转型 数据平台 火山引擎 企业号9月PK榜

状态空间模型可以在低功耗边缘计算中实现AI_AI&大模型_InfoQ精选文章