写点什么

国产大模型超越 Llama3!岩芯数智 RockAI 重新定义端侧智能

RockAI

  • 2024-08-20
    北京
  • 本文字数:1233 字

    阅读完需:约 4 分钟

大小:636.76K时长:03:37
国产大模型超越Llama3!岩芯数智RockAI重新定义端侧智能

8 月 18-19 日,AICon 全球人工智能开发与应用大会在上海举办,以“智能未来,探索 AI 无限可能”为主题,聚焦大模型开发与应用领域。RockAI CEO 刘凡平应邀出席并发表《非 Transformer 架构的端侧大模型创新研究与应用》主题演讲,重新定义端侧智能,引发了行业对端侧 AI 落地方向的全新思考。

 

众所周知,端侧 AI 通常指在终端设备上直接运行和处理人工智能算法的技术,具有减少云端算力依赖、保证用户数据安全等优势。目前,行业普遍将算力限制和数据匮乏视同端侧 AI 技术发展的拦路虎。而 RockAI 则认为,基础架构和核心算法的创新才是突破端侧 AI 发展局限的关键。基于对算法和架构的创新,即使面临算力限制,端侧 AI 仍可在终端设备上实现流畅的智能多模态运用。

 

这一观点也在 RockAI 关于 Yan 架构大模型的创新实践上得到了证明。其推出的国内首个非 Attention 机制的 Yan 架构大模型,可在主流消费级 CPU 等端侧设备上无损运行,达到其他模型 GPU 上的运行效果。全面升级后,Yan1.2 多模态大模型,已经可以在树莓派、机器人、手机等低功耗计算平台无损流畅运行,将端侧应用场景拓宽至智能家居、物联网等领域。而最新数据显示,3B 参数的 Yan1.3 preview 大模型在各项测评中的平均得分甚至超越了 8B 参数的 Llama3,达到极高的知识密度。



论坛现场,刘凡平深入剖析了当前端侧 AI 技术的发展现状及局限性。他指出,目前大多数“狭义端侧模型”的核心目标在于为用户提供大语言模型推理服务,受限于模型参数、算力、软件生态、功耗控制等诸多难题,往往会通过压缩、分割等软硬件协同优化实现大语言模型在终端设备上的本地化应用。但端侧 AI 的未来不仅仅在于推理能力的提升,更在于能够实现模型的自我学习和优化,以适应不断变化的应用场景和愈发广阔的用户需求。而通过以上处理手段,模型是无法在端侧进行训练和微调的,更不必说实现自我学习。

 

刘凡平强调,RockAI 不做“狭义的端侧模型”,而是着眼于更广泛意义上的端侧智能,即让世界上每一台设备都拥有自己的智能。这要求端侧模型除了语言理解及生成能力外,还应该具备抽象思考、因果推理、自我反思以及跨领域迁移学习等更复杂的认知功能。因此,端侧模型需要至少支持“理解表达、选择遗忘、持续学习”三种基础能力。

 

为达成这一目标,RockAI 在基础架构创新和实现消费级终端无损部署外,首创了“同步学习”机制。该机制可以使大模型在推理的同时进行知识更新和学习,建立自己独有的知识体系,实现模型的边跑边进化。同时,通过跨模态关联学习,增强模型在多场景下的应用能力,实现秒级实时反馈的人机交互,真正做到端侧模型的自我学习、类人感知和实时交互,推动端侧 AI 向自适应智能进化阶段演进。

 

RockAI 基于 Yan 架构大模型的技术突破和创新实践,打破了当前端侧 AI 发展的技术壁垒,不仅为整个行业的发展提供了新的思路和方向,也预示着端侧 AI 正朝着更广泛的应用场景稳步前进。待同步学习+全模态+实时人机交互落地后,Yan2.0 的诞生将重新定义端侧智能,真正赋予机器自主学习与自我优化能力,构建持续进化乃至群体智能涌现的 AGI 智慧生态。

2024-08-20 17:029413

评论

发布
暂无评论
发现更多内容

Amazon Q Developer CLI 如何提升独立游戏开发者的开发体验

亚马逊云科技 (Amazon Web Services)

Story 与 OKX Ventures 发千万基金,押注 IP+AI 交叉领域

股市老人

DApp的外包开发流程

北京木奇移动技术有限公司

dapp开发 区块链开发 软件外包公司

DApp开发框架及特点

北京木奇移动技术有限公司

区块链技术开发 dapp开发 软件外包公司

电子科技大学 鲲鹏昇腾科教创新孵化中心揭牌,打造中国算力生态“成电范式”

极客天地

MindIE服务化性能MindIE service如何调优?不考虑时延的极限吞吐场景

zjun

昇腾 模型推理 Ascend

硬派越野也懂美学设计纵横G700品鉴即将开启

科技热闻

鸿蒙Next并发线程TaskPool使用

auhgnixgnahz

鸿蒙Next

鸿蒙Next实现通讯录索引条AlphabetIndexer

auhgnixgnahz

鸿蒙Next

网站域名是什么,怎么注册?一文讲清楚域名注册管理那些事

国科云

真的要动起来了

王中阳Go

程序员 运动

数据可视化与能源管理的技术分野:Grafana 与 MyEMS 深度对比

开源能源管理系统

开源 Grafana 能源管理 开源能源管理系统

HarmonyOSNext性能调优圣典可视化分析+命令行实战避坑指南

Turing_010

微店商品详情API接口详解

tbapi

微店商品详情接口 微店API 微店商品数据采集 微店商品详情数据采集

缩放、镜像、偏移,用好这3个CAD功能,让图纸修改效率狂飙!

在路上

cad cad看图 CAD看图王

深度解析ISO 50007-结合MyEMS开源系统的能源服务技术实践

开源能源管理系统

开源 能源管理 开源能源管理 iso 50007

区块链 RWA 系统的主要功能

北京木奇移动技术有限公司

区块链技术 软件外包公司 RWA开发

彩讯AI邮箱荣获"华为鸿蒙办公创新合作奖",Rich M@il全面预装华为线下门店

彩讯股份300634

Ascend如何测试集合通信(HCCL)的功能正确性以及性能?

zjun

昇腾 模型推理 Ascend

使用DataSecurity Plus监控Windows文件完整性

运维有小邓

日志管理 IT运维 文件监控

MindIE服务化性能MindIE service如何调优?首token时延限制严格,非首token时延也有限制

zjun

昇腾 模型推理 Ascend NPU

「HarmonyOSNext性能调优秘籍:HiTraceMeter全场景追踪指南」

Turing_010

实战案例 | 高德地图MCP+DeepSeek 接入实现火警智能应急系统

高德开放平台

Java AI 前端 高德地图 MCP

浩辰软件斩获鸿蒙办公行业先锋奖,为鸿蒙生态注入CAD新活力

在路上

cad 浩辰CAD CAD看图王

MindIE服务化性能MindIE service如何调优?限制非首token时延的极限吞吐

zjun

性能优化 模型推理 Ascend NPU

生成式AI服务再添合规标杆:iCourt旗下AlphaGPT完成备案

科技汇

CST软件如何启用stage view背景渲染和爆炸图

思茂信息

cst操作 cst电磁仿真 CST软件 CST Studio Suite

软件测试工程师如何用DeepSeek写测试用例:效率飙升的秘密武器!

测试人

人工智能 软件测试 DeepSeek

跨境卖家必看:1688商品列表页面数据接口抓取攻略

tbapi

1688商品列表接口 1688API 1688商品数据采集

Apache Cloudberry 向量化实践(一):为什么要优化向量数据重分布性能?

酷克数据HashData

AI 技术在语言学习中的应用

北京木奇移动技术有限公司

AI教育 软件外包公司 AI技术应用

国产大模型超越Llama3!岩芯数智RockAI重新定义端侧智能_AI&大模型_InfoQ精选文章