写点什么

达摩院开源具身智能“三大件” 机器人上下文协议首次开源

达摩院

  • 2025-08-11
    北京
  • 本文字数:1081 字

    阅读完需:约 4 分钟

大小:532.77K时长:03:01
达摩院开源具身智能“三大件” 机器人上下文协议首次开源

8 月 11 日消息,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。

 

具身智能领域飞速发展,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。达摩院将 MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了 RCP(Robotics Context Protocol)协议以推动不同的数据、模型与本体之间的对接适配。达摩院打造了名为 RynnRCP 的一套完整的机器人服务协议和框架,能够打通从传感器数据采集、模型推理到机器人动作执行的完整工作流,帮助用户根据自身场景轻松适配。RynnRCP 现已经支持 Pi0、GR00T N1.5 等多款热门模型以及 SO-100、SO-101 等多种机械臂,正持续拓展。

 


具体而言,RynnRCP 包括 RCP 框架和 RobotMotion 两个主要模块。RCP 框架旨在建立机器人本体与传感器的连接,提供标准化能力接口,并实现不同的传输层和模型服务之间的兼容。RobotMotion 则是具身大模型与机器人本体控制之间的桥梁,能将离散的低频推理命令实时转换为高频的连续控制信号,实现平滑、符合物理约束的机器人运动。同时,RobotMotion 还提供了一体化仿真-真机控制工具,帮助开发者快速上手,支持任务规控、仿真同步、数据采集与回放、轨迹可视化等功能,降低策略迁移难度。

 

大会上,达摩院还宣布开源两款具身智能大模型。RynnVLA-001 是达摩院自主研发的基于视频生成和人体轨迹预训练的视觉-语言-动作模型,其特点是能够从第一人称视角的视频中学习人类的操作技能,隐式迁移到机器人手臂的操控上,从而让机械臂操控更加连贯、平滑,更接近于人类动作。

 

世界理解模型 RynnEC 将多模态大语言模型引入具身世界,赋予了大模型理解物理世界的能力。该模型能够从位置、功能、数量等 11 个维度全面解析场景中的物体,并在复杂的室内环境中精准定位和分割目标物体。无需 3D 模型,该模型仅靠视频序列就能建立连续的空间感知,还支持灵活交互。

 

据了解,达摩院正积极投入具身智能,聚焦于系统和模型研发,与多方共建产业基础设施,包括硬件本体和标准组件适配、数据采集,以及技术社区 DAMO 开发者矩阵等,希望拓展机器人的产业空间,加速场景落地。达摩院还在上月开源了 WorldVLA 模型,首次将世界模型与动作模型融合,提升了图像与动作的理解与生成能力,受到业界关注。

 

开源链接:

机器人上下文协议 RynnRCP

https://github.com/alibaba-damo-academy/RynnRCP

视觉-语言-动作模型 RynnVLA-001

https://github.com/alibaba-damo-academy/RynnVLA-001

世界理解模型 RynnEC

https://github.com/alibaba-damo-academy/RynnEC

2025-08-11 13:513779

评论

发布
暂无评论

区块链农场游戏系统开发软件定制

TypeScript | 第三章:函数、泛型和枚举

梁龙先森

typescript 编程 大前端 七日更

腾讯T4架构师:刷3遍以下面试题,你也能从小公司成功跳到大厂

Java架构之路

Java 程序员 架构 面试 编程语言

FastAI:滴普技术荟:基于机器视觉的典型多目标追踪算法应用实践

目标追踪 目标检测 追踪算法

如何成为架构师?

xcbeyond

个人成长 架构师 七日更

假冒、诈骗、隐私安全,如何应对数字人民币的风险与挑战?

CECBC

货币

LeetCode题解:92. 反转链表 II,迭代,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

关于昆明市政协、市统战部、民革昆明市委赴云南坤艮盈科技有限公司(商务部CECBC区块链专委会秘书处云南办事处)调研指导工作

CECBC

云南发展

FastAI:滴普技术荟:基于深度学习的云边一体化OLED屏缺陷自动光学检测技术

学习 缺陷检测 云边一体 自动光学检测

职业规划

Albert

职业规划 七日更

让你的简历不落窠臼,精雕细镂写一份真正的技术简历(Python向)

刘悦的技术博客

Python 面试 简历优化 简历

SQL优化最干货总结-MySQL「2020年终总结版」

Java架构师迁哥

[git使用技巧] git提交忽略不必要的文件或文件夹

xcbeyond

git 七日更

Nginx常见典型故障|Linux干货

赖猫

c++ nginx Linux

彩色的线,数据的诗,你好——贵州鲲鹏!

脑极体

使用 Helmfile 解放你的 Helm Chart

郭旭东

云原生 Helm

远见而明察近观若明火|Centos7.6环境基于Prometheus和Grafana结合钉钉机器人打造全时监控(预警)Docker容器服务系统

刘悦的技术博客

Docker 高可用 监控 Prometheus 预警

比特币的安全性到底有多高?

CECBC

比特币

低代码与零代码工具的这些特征,弥补了所有人和IT之间的差距!

J2PaaS低代码平台

程序员 互联网 开发者 软件开发 开发工具

wildfly 21的domain配置

程序那些事

程序那些事 wildfly wildfly21 配置管理 domain模式

JVM 的运行时数据区域分布

rookiedev

Java JVM

区块链矿机挖矿系统开发软件技术

Ribbon使用及其内核原理剖析

Fox666

数据为墨,智能作笔:画一卷新姑苏繁华图

脑极体

“社恐”独处好去处:无人自习室,一个人的“世外桃源”

IoT云工坊

物联网 无人自习室 智能门禁 智能灯控 线上预约

业务中台建设 - 配置化

孝鹏

中台 微服务 配置化开发

Java 细粒度锁续篇

rookiedev

Java 多线程 加锁

转型项目经理?

escray

面试 面经 七日更 十日谈

FastAI:滴普技术荟:某工业产品内部结构尺寸图像测量和缺陷检测分析

AI 目标检测 图像处理 缺陷检测 图像检测

用大白话给你解释Zookeeper的选举机制

爱笑的架构师

zookeeper ZooKeeper原理 七日更

规模化敏捷框架何从入手?这篇文章把SAFe讲透了!

华为云开发者联盟

敏捷开发 框架 safe

达摩院开源具身智能“三大件” 机器人上下文协议首次开源_AI&大模型_InfoQ精选文章