写点什么

非 Transformer 架构大模型公司岩芯数智 RockAl 走通类脑机制:端侧 AI 也可以很智能|WAIC 专题报道

  • 2024-07-05
    北京
  • 本文字数:1998 字

    阅读完需:约 7 分钟

大小:1017.08K时长:05:47
非Transformer架构大模型公司岩芯数智RockAl走通类脑机制:端侧AI也可以很智能|WAIC专题报道

7 月 4 日-7 月 7 日,2024 世界人工智能大会(WAIC)在上海举行,来自国内外的数百款大模型集体亮相,呈现了 AI 大模型智能涌现、赋能千行百业的生动场景。在各色技术及应用的创新体验区中,一个具备高度交互能力的多模态机器人引起了人们的注意。


它就是来自岩芯数智 RockAI,搭载了树莓派 5 代芯片的“小智”,在极低算力的设备上实现了强大的多模态能力。



继年初推出超强性能的 Yan1.0 云端大模型后,RockAI 再次突破了端侧 AI“原生无损”门槛,并在这款机器人上部署了此次首发的 Yan 1.2 大模型。


与传统的自动控制机器人不同,小智具备多模态认知能力,能够基于 Yan 1.2 的语音和视觉处理能力,准确理解用户的模糊指令和意图,并据此控制其机械躯体完成各类复杂任务。随着这款智能机器人在各种模糊指令下描述“视觉”场景、展现“四步成诗”,一场关于端侧 AI 的全新想象也铺展开来。


端侧 AI 打响突围赛

端侧 AI 通常指在终端设备上直接运行和处理人工智能算法的技术,其优势在于可以直接利用设备的计算能力进行数据处理,不需要将数据发送到云端或服务器进行处理,从而降低对云端计算资源的依赖。且无论网络环境如何都能即时生成响应,确保用户数据安全性的同时,减少了相关算力成本开支。


自去年下半年以来,随着大模型的竞争从技术驱动过渡到市场驱动,端侧 AI 以其广泛的应用场景备受青睐,开始释放出全新的发展价值。全球范围内各大模型厂商纷纷通过各种技术手段,尝试将大模型在物理意义上融入终端。


但受制于端侧 AI 落地的算力和功耗等挑战,传统轻量化部署往往均以性能损失为代价。如目前大热的 AIPC 是把 Transformer 架构的模型通过量化压缩部署到个人电脑,仅 70 亿参数的大模型还需要额外定制 PC 芯片为其提供算力。而此前在微型电脑主板树莓派 5 上打出“1.89tokens 每秒速度运行、支持 8K 上下文窗口”战绩的 Llama3 8B,同样止步于“有损压缩”。压缩后的模型不仅性能大打折扣,还会失去再训练、再学习的能力,成为无法定时更新底层知识的“一次性 AI”。

基于仿生神经元驱动的选择算法,Yan 1.2 更专注于端侧设备

RockAI 此次首发的 Yan 1.2 大模型,可以“原生无损”地以 6+tokens/s 的速度运行于算力仅普通电脑八分之一的树莓派上,并在这个仅有信用卡大小的芯片上实现超强的多模态能力,不仅能“听说读”,还可以识别模糊指令,进行学习、创作及互动。


这一成果,起初是得益于对于大模型基础架构的“破坏式”创新。早在今年 1 月,RockAI 发布了国内首个非 Transformer 的 Yan 架构大模型。该架构通过对 Attention 机制的替换,将计算复杂度降为线性,大幅降低了对算力的需求,用百亿级参数达成千亿参数大模型的性能效果,并且率先实现了在主流消费级 CPU 等端侧设备上的原生无损运行。


为了实现树莓派等更多更低端设备的无损适配,RockAI 基于全新自研的 Yan 架构,在实验室对人工神经网络最底层的反向传播算法进行挑战,寻找反向传播的更优解尝试,进一步实现 Yan 模型的降本增效。同时在算法侧,RockAI 采用了基于仿生神经元驱动的选择算法,实现了类脑分区激活的工作机制,使大模型可以根据学习的类型和知识的范围分区激活,大幅减少了数据训练量,同时也能有效发挥多模态的潜力。故而,模型迭代到 1.2 版本,已经可以实现在 PC 端、手机端、树莓派端和机器人端等设备上的无损运行。

“同步学习”打造设备端“最强大脑”


历经了卷参数、卷市场的阶段,大模型当下正集中于一个“卷智能”的时代,因此,让大模型无损跑通更多低算力设备只是第一步,接下来就要思考如何提高端侧大模型的知识密度、智能密度。但 RockAI CEO 刘凡平还有一个更高的目标,就是在实现通用人工智能的同时,将 AI 与每个人独特的地方结合在一起,模型具备自主学习能力,让每个设备都拥有个性化的智能。


为了实现这种个性化的通用人工智能,RockAI 团队首创了“同步学习”理念,让模型具备像人一样实时学习的能力,在推理的同时进行知识更新和学习,无需像云端大模型一样“返厂”进行再次更新或预训练。从而实时、有效且持续性地提升大模型的智能密度,应对各类个性化场景中出现的问题。


基于神经网络的底层技术创新,RockAI 不断尝试寻找反向传播的更优解,试图能更低代价更新神经网络,实现对现有知识体系的快速更新,辅以模型分区激活降低功耗、实现部分更新,使大模型像人类学习一样建立自己独有的知识体系,实现模型的边跑边进化。会上,RockAI 展示了“同步学习”的实验室示例,并表示该机制已处于实验室最后验证阶段。


而对于 Yan 模型在设备端的落地,刘凡平则透露,团队正加紧进行设备端的适配工作,目前已与众多硬件和芯片厂商建立了沟通与合作。


RockAI 以 Yan 架构大模型为核心的技术突破与创新实践,标志着端侧 AI 正逐步克服技术壁垒,向更广泛的应用场景迈进。不仅是对现有计算范式的挑战与超越,更是对未来智慧生活的前瞻布局。

随着全模态支持+实时人机交互+同步学习的落地,Yan 2.0 或将重新定义设备的价值,成为设备的“最强大脑”,真正做到“让世界上每一台设备都拥有自己的智能”。


2024-07-05 00:316057
用户头像
李冬梅 加V:busulishang4668

发布了 1229 篇内容, 共 847.0 次阅读, 收获喜欢 1323 次。

关注

评论

发布
暂无评论
发现更多内容

超前探展!2025 云栖大会朋友圈晒图必备

阿里巴巴云原生

深入研究:京东工业商品详情API详解

tbapi

京东工业平台API 京东工业数据采集 京东工业商品详情API 京东工业数据分析

邀您参加丨云栖大会中企出海技术分论坛

阿里巴巴云原生

阿里云 云原生

深入解析MS12-020关键漏洞CVE-2012-0002:远程桌面协议的安全风险与缓解方案

qife122

网络安全 系统加固

多客云 Ai 短视频批量剪辑矩阵系统:高效创作与智能管理的一体化解决方案

微擎应用市场

喵喵估价回收管理系统:一站式闲置回收解决方案

微擎应用市场

坐标山东青岛,12~20K面试强度

王中阳Go

Go 面试 后端

Web自动化测试智能体详解

测试人

人工智能 软件测试

海之心医院挂号系统:中小型医疗机构的智慧诊疗管理解决方案

微擎应用市场

嘉为蓝鲸2025OpsPilot智能运维支撑平台V3.7:分块界面可视化,重构问答对关联提升运维知识效率

嘉为蓝鲸

知识管理 智能运维 OpsPilot 一体化智能运维 智能运维支撑平台

建筑行业能源管理破局:MyEMS 打造商业楼宇 “能耗可视化 + 智能调控” 方案

开源能源管理系统

开源 开源能源管理系统

告别数据越权烦恼,嘉为蓝鲸CMeas研发效能洞察平台靠数据行权限隔离,保障项目数据安全

嘉为蓝鲸

DevOps 研发效能 研发效能度量 数据管控 研发效能洞察平台

JoyAgent-DataAgent可直接使用的智能问数和诊断分析智能体

京东科技开发者

第柒在线科技通过“2025国家科技型中小企业”认定

第七在线

一场 MCP 生态的变革——详解 OpenTiny NEXT 逆向思维的技术创新

OpenTiny社区

AI 前端 OpenTiny MCP

Playwright极速UI自动化实战指南

测试人

人工智能 软件测试

嘉为蓝鲸CPack制品管理平台:容量管控减少无效存储,让制品管理更轻松降本提效

嘉为蓝鲸

智能告警 存储管理 制品库 制品管理 制品仓库

连接两个战场:本土舆情监测与海外社交媒体监控的协同

沃观Wovision

社交媒体 沃观Wovision 舆情监测系统 海外舆情监测

JDK从8升级到21的问题集

京东科技开发者

对接文档:快递鸟取件码API,实现物流末端服务自动化

快递鸟

文心快码入选2025人工智能AI4SE“银弹”标杆案例

Comate编码助手

AI辅助编程 AI 编程 文心快码Zulu 文心快码3.5S

Playwright自动化测试框架与AI智能体应用

测试人

嘉为蓝鲸2025应用发布中心V6.2:国产化数据库适配+Function-Call技术,赋能云原生

嘉为蓝鲸

云原生 应用发布 智能运维 应用发布中心 国产化适配

撒钱岛小游戏管理系统:私域流量变现新选择,趣味与收益双赢

微擎应用市场

从 AI 编程到小程序容器:外卖 App 开发实战之 App Builder 技术选型指南

xuyinyin

行稳、致远 | 技术驱动下的思考感悟

京东科技开发者

告别“能源糊涂账”:MyEMS如何帮企业把能耗数据“算明白、用到位”

开源能源管理系统

开源 开源能源管理系统

MyEMS 进阶应用:从单厂能耗管理到集团跨区域能源数据协同分析

开源能源管理系统

开源 开源能源管理系统

深入研究:京东图片搜索相似商品API详解

tbapi

京东图片搜索接口 京东拍立淘API 京东图片搜索API 京东图片API 京东图搜API

非Transformer架构大模型公司岩芯数智RockAl走通类脑机制:端侧AI也可以很智能|WAIC专题报道_生成式 AI_李冬梅_InfoQ精选文章