写点什么

谷歌又发两款全新 AI 模型:能指挥机器人整理桌面、折纸,操作异常丝滑

  • 2025-03-13
    北京
  • 本文字数:1058 字

    阅读完需:约 3 分钟

大小:452.93K时长:02:34
谷歌又发两款全新AI模型:能指挥机器人整理桌面、折纸,操作异常丝滑

美国当地时间 3 月 12 日,谷歌 DeepMind 团队宣布推出两款基于 Gemini 2.0 的机器人模型:一个是 Gemini Robotics,这是一个先进的视觉-语言-动作 (VLA) 模型,建立在 Gemini 2.0 的基础上,并增加了物理动作作为新的输出方式,用于直接控制机器人;另一个是 Gemini Robotics-ER,这是一个具有先进空间理解能力的 Gemini 模型,使机器人专家能够利用 Gemini 的具身推理 (ER) 能力运行自己的程序。

 

谷歌在官方博客中称,“在 Google DeepMind,我们在 Gemini 模型如何通过跨文本、图像、音频和视频的多模态推理解决复杂问题方面取得了进展。然而,到目前为止,这些能力主要局限于数字领域。为了使人工智能在物理领域对人类有用和有帮助,它们必须展示‘具身’推理——像人类一样理解和响应我们周围世界的能力——以及安全地采取行动来完成任务。”

 

谷歌 DeepMind 已在 Gemini Robotics 模型方面,和 Apptronik、Agile Robots、Agility Robots、Boston Dynamics 和 Enchanted Tools 等展开合作。

 

谷歌强调,为了对人类有用和有帮助,机器人的人工智能模型需要具备三个主要特质:它们必须具有通用性,这意味着它们能够适应不同的情况;它们必须具有交互性,这意味着它们能够理解指令或环境变化并快速做出反应;它们必须具有灵巧性,这意味着它们可以做人们通常用手和手指可以做的事情,比如小心地操纵物体。

 

具体来讲,这些模型能做什么?

 

DeepMind 发布了一系列演示视频,展示了配备 Gemini Robotics 的机器人如何折叠纸张、完成更精细的抓取动作以及响应语音命令执行其他任务。

 



DeepMind 实验室称,Gemini Robotics 经过训练,可以泛化各种不同机器人硬件的行为,并将机器人可以“看到”的物品与它们可能采取的行动联系起来。

 



谷歌表示:“虽然我们之前的工作在这些领域取得了进展,但 Gemini Robotics 在所有三个轴的性能上都迈出了实质性的一步,使我们更接近真正的通用机器人。”



值得一提的是,谷歌 DeepMind 正在与 Apptronik 合作“打造下一代人形机器人”。它还向“受信任的测试人员”开放了 Gemini Robotics-ER 模型,包括 Agile Robots、Agility Robotics、Boston Dynamics 和 Enchanted Tools。谷歌方面表示:“我们非常专注于打造能够理解物理世界并能够对物理世界采取行动的智能。我们非常高兴能够在多个实施例和许多应用中利用这一点。”

 

参考链接:

https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/?utm_source=keywordsnippet&utm_medium=referral

https://www.theverge.com/news/628021/google-deepmind-gemini-robotics-ai-models

2025-03-13 15:328637
用户头像
李冬梅 加V:busulishang4668

发布了 1225 篇内容, 共 841.1 次阅读, 收获喜欢 1319 次。

关注

评论

发布
暂无评论

1024:SQL注入

Changing Lin

10月月更

电商微服务拆分

白开水又一杯

#架构实战营

指标统计:基于流计算 Oceanus(Flink) 实现实时 UVPV 统计

腾讯云大数据

大数据 流计算 Oceanus

linux删除目录下文件的几种方法

入门小站

Liunx

IM场景的移动端UI自动化测试平台实践

轻口味

android 自动化测试平台 10月月更

(module6)电商微服务系统拆分

消失的子弹

在线英文字符串大写转小写,小写转大写工具

入门小站

工具

模块一作业

ks

架构实战营

毕业总结

Felix

ZK(ZooKeeper)分布式锁实现

牧小农

zookeeper ZooKeeper原理 zookeeper分布式锁

学生管理系统架构设计

孙志强

架构实战营

架构实战营模块一作业

孙志强

架构实战营

双十一即将到来,你的网站真的准备好了吗?

阿里巴巴云原生

阿里云 产品 云原生 云拨测

模块一作业

小鹿

腾讯云安全隐私计算通过 CFCA 评测,再获国家级认可

腾讯云大数据

大数据 隐私计算

架构实战营模块六作业

Geek_d18264

架构实战营

是极客,也是大娱乐家! 爱奇艺首届“黑客马拉松”见证“娱乐,未来已来”

爱奇艺技术产品团队

极客时间【架构实战营】第二期 模块六作业

Geek_91606e

架构实战营

Prometheus 内置函数(三)

耳东@Erdong

Prometheus PromQL 内置函数 10月月更

电商系统微服务拆分

Sky

「架构实战营」

设计电商秒杀系统

tjudream

架构实战营总结

gawaine

架构实战营

架构实战营-第三期-模块一作业

岚哲

极客时间 架构 架构实战营

学习心得 - 架构训练营 - 第六课

Fm

电商系统微服务拆分

Geek_db27b5

Redis 实现分布式锁

黄敏

架构实战营-第三期-学习总结

岚哲

极客时间 架构 架构实战营

电商系统微服务拆分设计

guangbao

026云原生之Exporter采集数据

穿过生命散发芬芳

云原生 10月月更

设计产品的十大可用性原则

石云升

产品经理 产品设计 产品思维 职场经验 10月月更

架构训练营总结

tjudream

谷歌又发两款全新AI模型:能指挥机器人整理桌面、折纸,操作异常丝滑_Google_李冬梅_InfoQ精选文章