硬核干货——《中小企业 AI 实战指南》免费下载! 了解详情
写点什么

谷歌 DeepMind 推出具身推理模型 Gemini Robotics-ER 1.5

作者:Daniel Dominguez

  • 2025-10-06
    北京
  • 本文字数:1128 字

    阅读完需:约 4 分钟

大小:559.13K时长:03:10
谷歌 DeepMind 推出具身推理模型 Gemini Robotics-ER 1.5

谷歌 DeepMind 近日推出 Gemini Robotics-ER 1.5,一款专为机器人应用打造的新型具身推理模型。目前,该模型已通过 Google AI Studio 和 Gemini API 以预览版的形式向开发者开放使用。一款用于机器人应用的新型具身推理模型。


Gemini Robotics-ER 1.5 是一款针对空间推理、多步规划以及物理环境执行任务而设计的模型。它能够输出与物体大小、重量及可操作性紧密相关的精准二维坐标点,从而支持诸如“指向你可以拿起的任何物体”等复杂指令。此外,开发者还可灵活调整思考预算,在响应延迟与推理准确性之间找到最佳平衡点。


该模型内置了安全机制,可有效防止生成不安全或物理上不可行的计划,同时会对载荷限制和工作空间约束进行严格检查。虽然它不直接控制机器人执行器,但可以调用外部工具——如视觉—语言-行动(VLA)模型或用户定义的函数来执行命令。Gemini Robotics 采用双模型架构,将推理模型与 VLA 对应模型相结合,从而使不同配置的机器人能够共享高级推理能力。目前,包括 Apptronik 在内的合作伙伴以及超过 60 名测试者正在积极参与该系统的使用与测试工作。

与其他应用于机器人技术的大模型(如 Nvidia VLA)相比,Gemini Robotics-ER 更加注重可控的推理深度与完善的安全机制。以往的系统侧重于直接的感知—行动映射,而 Gemini 引入了推理与执行之间的分离机制,使其能够更加便捷地适配多种不同的硬件平台。


最初的反馈呈现出兴趣与谨慎并存的局面。机器人工程师们特别强调,可调节的推理预算这一特性对于在推理准确性与部署速度之间实现平衡极为关键,尽管有些人担心将推理与驱动分离可能会增加延迟。


人工智能顾问 Sonia Sarao 对该模型的通用性方法给予了高度评价,她指出:

这种通用化的方法有望为机器人技术领域带来一场深刻的变革。显然,大型机器人公司会与谷歌合作,但即使是小型公司也可以直接从谷歌获得人工智能许可,并构建自己的机器人来解决特定问题。


注册会计师 Brian Orlando 将其视为一个真正的转折点,并发表了如下观点:

太神奇了。机器人能够推理、规划和迁移技能。这感觉像是一个真正的转折点。今天可以洗衣服,明天就能成为通用型的全能助手。


Gemini Robotics-ER 1.5 的发布为具身人工智能研究工具集增添了新成员,体现了当前人工智能模型发展的趋势——将推理与执行环节分离,同时还保持了强大的跨平台灵活性,能够适应多种不同的应用场景和硬件平台。DeepMind 报告称,该系统在 15 项机器人基准测试中均取得了最先进的性能表现,并展示了从双臂实验室机器人到仿人机器人的各种平台的兼容性。其设计目标是打造一个统一的、可适应性强的软件堆栈,能够在不同的机器人形态因素上运行,支持从实验室测试到实际部署的过渡。


原文链接

https://www.infoq.com/news/2025/09/deepmind-gemini-robotics/

2025-10-06 20:574

评论

发布
暂无评论
发现更多内容

怪兽AI数字人直播软件

Mr_song

AI 短视频 直播 数字人

IDC 权威认可!Aloudata 入选金融领域中数据管理分析服务最佳实践案例

Aloudata

数据分析 自动化 IDC 全链路数据血缘 金融数据

在数字化时代保持企业财务管理的持续技术创新

智达方通

人类将会永生?谷歌 DeepMind重磅发布Alphafold 3 ——天花板级别的AI系统

GPU算力

深度学习 DeepMind 生物信息学 AlphaFold 蛋白质预测

个人名片升级攻略:ChatGPT助您塑造独特简历风格

测试人

软件测试 简历 ChatGPT

怎么查询游戏服务器IP?哪些工具可以协助?

一只扑棱蛾子

服务器

Django性能之道:缓存应用与优化实战

不在线第一只蜗牛

sqlite django 缓存

产品经理必备的API技术知识

幂简集成

产品经理 API

一键自动化博客发布工具,用过的人都说好(csdn篇)

程序那些事

工具 程序那些事 自动发布

深入解析Apache Flink核心概念:事件流、状态、事件时间和快照

木南曌

实时计算

NFTScan | 05.06~05.12 NFT 市场热点汇总

NFT Research

NFT NFT\ NFTScan

特权账号管理的那些坑

芯盾时代

iam 统一身份认证 特权账号管理

外贸网站优化为什么要布置内部链接?如何优化内链?

九凌网络

电商后台的秘密:通过API接口提取商品信息

Noah

海外云手机——电商最有效的引流工具

Ogcloud

云手机 海外云手机 云手机海外版 电商云手机 跨境云手机

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

GPU算力

深度学习 英伟达 Blackwell GB200

建木Hub流水线正式版上线啦!!限时送200分钟体验时长

都广科技

DevOps

大厂技术同学的落地困境

老张

团队管理 职业规划 职场发展 大厂求职

谷歌 DeepMind 推出具身推理模型 Gemini Robotics-ER 1.5_Google_InfoQ精选文章