写点什么

国产大模型超越 Llama3!岩芯数智 RockAI 重新定义端侧智能

RockAI

  • 2024-08-20
    北京
  • 本文字数:1233 字

    阅读完需:约 4 分钟

大小:636.76K时长:03:37
国产大模型超越Llama3!岩芯数智RockAI重新定义端侧智能

8 月 18-19 日,AICon 全球人工智能开发与应用大会在上海举办,以“智能未来,探索 AI 无限可能”为主题,聚焦大模型开发与应用领域。RockAI CEO 刘凡平应邀出席并发表《非 Transformer 架构的端侧大模型创新研究与应用》主题演讲,重新定义端侧智能,引发了行业对端侧 AI 落地方向的全新思考。

 

众所周知,端侧 AI 通常指在终端设备上直接运行和处理人工智能算法的技术,具有减少云端算力依赖、保证用户数据安全等优势。目前,行业普遍将算力限制和数据匮乏视同端侧 AI 技术发展的拦路虎。而 RockAI 则认为,基础架构和核心算法的创新才是突破端侧 AI 发展局限的关键。基于对算法和架构的创新,即使面临算力限制,端侧 AI 仍可在终端设备上实现流畅的智能多模态运用。

 

这一观点也在 RockAI 关于 Yan 架构大模型的创新实践上得到了证明。其推出的国内首个非 Attention 机制的 Yan 架构大模型,可在主流消费级 CPU 等端侧设备上无损运行,达到其他模型 GPU 上的运行效果。全面升级后,Yan1.2 多模态大模型,已经可以在树莓派、机器人、手机等低功耗计算平台无损流畅运行,将端侧应用场景拓宽至智能家居、物联网等领域。而最新数据显示,3B 参数的 Yan1.3 preview 大模型在各项测评中的平均得分甚至超越了 8B 参数的 Llama3,达到极高的知识密度。



论坛现场,刘凡平深入剖析了当前端侧 AI 技术的发展现状及局限性。他指出,目前大多数“狭义端侧模型”的核心目标在于为用户提供大语言模型推理服务,受限于模型参数、算力、软件生态、功耗控制等诸多难题,往往会通过压缩、分割等软硬件协同优化实现大语言模型在终端设备上的本地化应用。但端侧 AI 的未来不仅仅在于推理能力的提升,更在于能够实现模型的自我学习和优化,以适应不断变化的应用场景和愈发广阔的用户需求。而通过以上处理手段,模型是无法在端侧进行训练和微调的,更不必说实现自我学习。

 

刘凡平强调,RockAI 不做“狭义的端侧模型”,而是着眼于更广泛意义上的端侧智能,即让世界上每一台设备都拥有自己的智能。这要求端侧模型除了语言理解及生成能力外,还应该具备抽象思考、因果推理、自我反思以及跨领域迁移学习等更复杂的认知功能。因此,端侧模型需要至少支持“理解表达、选择遗忘、持续学习”三种基础能力。

 

为达成这一目标,RockAI 在基础架构创新和实现消费级终端无损部署外,首创了“同步学习”机制。该机制可以使大模型在推理的同时进行知识更新和学习,建立自己独有的知识体系,实现模型的边跑边进化。同时,通过跨模态关联学习,增强模型在多场景下的应用能力,实现秒级实时反馈的人机交互,真正做到端侧模型的自我学习、类人感知和实时交互,推动端侧 AI 向自适应智能进化阶段演进。

 

RockAI 基于 Yan 架构大模型的技术突破和创新实践,打破了当前端侧 AI 发展的技术壁垒,不仅为整个行业的发展提供了新的思路和方向,也预示着端侧 AI 正朝着更广泛的应用场景稳步前进。待同步学习+全模态+实时人机交互落地后,Yan2.0 的诞生将重新定义端侧智能,真正赋予机器自主学习与自我优化能力,构建持续进化乃至群体智能涌现的 AGI 智慧生态。

2024-08-20 17:029281

评论

发布
暂无评论
发现更多内容

AI视频创作一条龙!达摩院“寻光”平台炸场WAIC,突破可控编辑难题

Openlab_cosmoplat

人工智能 AI 视频

华为云发起,openGemini正式成为CNCF官方项目!

华为云开源

云原生 时序数据库 cncf openGemini 华为云开源

非营利组织的数据治理之路

郑州埃文科技

数据治理

淘宝/天猫商品详情API接口与电商数据仓库的实时同步实践

技术冰糖葫芦

API Explorer API 文档 API 协议 pinduoduo API

VMware ESXi 8.0U3 macOS Unlocker & OEM BIOS Marvell AQC 网卡驱动定制版

sysin

macos esxi OEM BIOS aqc

讯飞晓医APP再升级!上线数字健康空间,更懂健康更懂你

EVANjesse

智慧医疗 科大讯飞 AIGC 讯飞星火 医疗健康

What's new in PikiwiDB(Pika) v4.0.0

apache/dubbo-go

服务韧性工程(SRE)论坛演讲实录 | 基于可观测性构建SRE运维体系经验分享

雅菲奥朗

运维 可观测性 SRE

2023首届服务韧性工程(SRE)论坛分会场:数据中心运维的新发展

雅菲奥朗

人工智能 大数据 运维 SRE

服务韧性工程(SRE)论坛演讲实录 | 雅菲奥朗:SRE是数字化转型时代基础设施能力

雅菲奥朗

运维 可观测性 SRE #DevOps

企业协同办公+应用开发平台:推动数字化转型的新引擎

不在线第一只蜗牛

低代码 数字化 企业团队协同

腾讯云流计算 Oceanus:新版弹性方案,助力实时业务降本超30%

腾讯云大数据

流计算 Oceanus

倒计时 2 周!CommunityOverCode Asia 2024 IoT & Community 专题部分

Greptime 格睿科技

Apache 数据库 IoT 社区 apache 社区

2023年首届服务韧性工程(SRE)论坛成功举办

雅菲奥朗

人工智能 云计算 大数据 运维 SRE

2023首届服务韧性工程(SRE)论坛分会场:聚焦SRE的实践和应用

雅菲奥朗

人工智能 运维 可观测性 SRE

服务韧性工程(SRE)论坛演讲实录 | 浙江移动:运营商ICT项目SRE运维的探索与实践

雅菲奥朗

运维 SRE

重磅发布 | 中国信通院首个“低代码&无代码产业双象限”正式发布!共计34家企业上榜!

信通院IOMM数字化转型团队

低代码 无代码 低代码平台 无代码平台 企业数字化转型发展双象限

国产大模型超越Llama3!岩芯数智RockAI重新定义端侧智能_AI&大模型_InfoQ精选文章