AICon 深圳站聚焦 Agent 技术、应用与生态,大咖分享实战干货 了解详情
写点什么

DeepMind 推出 Genie 3,一款文本到 3D 的交互式世界模型

作者:Daniel Dominguez

  • 2025-08-19
    北京
  • 本文字数:906 字

    阅读完需:约 3 分钟

大小:440.69K时长:02:30
DeepMind推出Genie 3,一款文本到3D的交互式世界模型

DeepMind 推出了Genie 3,这是其世界模型框架的最新版本,用于直接从文本提示生成交互式 3D 环境。该系统在 720p 分辨率下以大约每秒 24 帧的速度实时渲染场景,允许连续导航和交互数分钟而无需重置场景。与早期版本相比,它的核心改进之一是对象持久性:对环境所做的任何更改,如移动、删除或更改对象,都会随着时间的推移保持持久性。该模型还保持了一致的物理特性,无需使用单独的内存模块,而是依赖于学习到的世界动态。

 

Genie 3将这些工具的各个方面整合到一个单一的生成管道中。它既可以作为一个从自然语言产生独特环境的内容创建系统,也可以作为一个测试自主代理的仿真平台。该模型可以完全从文本中创建各种设置,如室内工业布局、室外自然地形或复杂的障碍路线。这种灵活性使其适合于训练场景的快速原型设计,特别是在机器人和具身智能领域,多样化和动态的世界对开发可泛化的技能至关重要。

 

该方法将 Genie 3 与其他生成式 AI 系统区别开来。例如,OpenAI 的Sora可以从文本描述中产生高度逼真的视频,但仅限于固定长度的剪辑,不支持实时交互。Meta 的Habitat专注于具身智能研究,为智能体提供高保真的 3D 空间,用于导航和操纵任务。然而,Habitat 需要预定义的场景和资产,而不是从提示中程序化地生成它们。NVIDIA 的Isaac Sim提供了先进的机器人仿真功能,具有详细的传感器建模和物理特性,但同样依赖于手动构建或导入的环境。基于《我的世界》(Minecraft)构建的MineDojo允许 AI 智能体在程序生成的世界中操作,但其机制和基于方块的视觉效果限制了现实感和物理准确性。

 

Reddit 用户在r/singularity 上分享了一些关于 Genie 3 的看法,其中一位用户评论道:

 

想象一下,过去几年你一直与世隔绝,然后突然看到了这个。这简直就像科幻小说里的情节,像是《星际迷航》里的东西。

 

而另一位用户评论道:

 

现在把这个接入虚拟现实(VR),基本上就是元宇宙了。

 

虽然传统的模拟引擎如Unreal EngineUnity等也支持自定义环境,但它们通常需要资源库和手动场景组装。Genie 3 则通过按需生成环境绕过了这一步骤,不过与专用游戏引擎相比,其当前的局限性包括运行持续时间和环境复杂性。

 

原文链接:

https://www.infoq.com/news/2025/08/deepmind-genie-virtual/

2025-08-19 12:001

评论

发布
暂无评论

【TiDB 4.0 新特性系列】BR 特性及原理解读

TiDB 社区干货传送门

DM2.0初体验

TiDB 社区干货传送门

pd集群多副本数据丢失以及修复实践

TiDB 社区干货传送门

实践案例

微众银行数据库架构演进及 TiDB 实践经验

TiDB 社区干货传送门

实践案例

【TiDB 最佳实践系列】PD 调度策略最佳实践

TiDB 社区干货传送门

实践案例

Flink 最佳实践之 通过 TiCDC 将 TiDB 数据流入 Flink

TiDB 社区干货传送门

性能调优

小红书数据架构及 TiDB 使用场景

TiDB 社区干货传送门

使用Zabbix监控TiDB(一)

TiDB 社区干货传送门

实践案例

TiDB HTAP 深度解读

TiDB 社区干货传送门

线上mysql改表操作导致tidb同步延迟解决方法

TiDB 社区干货传送门

DM问题处理总结

TiDB 社区干货传送门

DM同步过程问题汇总

TiDB 社区干货传送门

TiDB 4.0 新 Feature 原理及实践:统一读线程池

TiDB 社区干货传送门

DM v1 升级v2初体验

TiDB 社区干货传送门

Placement Rules 原理

TiDB 社区干货传送门

TiDB 底层架构

docker方式部署的tidb-v3.0扩容缩容pd节点后需要滚动升级整个集群

TiDB 社区干货传送门

TiDB 监控架构解读

TiDB 社区干货传送门

监控

把云数据库服务变成黑盒子:ServerlessDB for HTAP丨Hacking Camp 进行时

TiDB 社区干货传送门

实践案例

一次 meet_lock 告警异常处理过程

TiDB 社区干货传送门

实践案例 故障排查/诊断

TiDB Coprocessor 学习笔记

TiDB 社区干货传送门

TiDB 底层架构

PD api基础框架源码分析

TiDB 社区干货传送门

TiDB 底层架构

国产主流数据库调研

TiDB 社区干货传送门

性能调优 实践案例

从使用者到开发者,知乎参与 TiDB 社区背后的故事

TiDB 社区干货传送门

实践案例 数据库架构选型

TiDB大规模删除实践

TiDB 社区干货传送门

管理与运维

伴鱼数据库之监控系统

TiDB 社区干货传送门

TiCDC使用心得

TiDB 社区干货传送门

TiDB AutoCommit OFF 问题

TiDB 社区干货传送门

实践案例 故障排查/诊断 新版本/特性发布

PD api基础框架源码分析

TiDB 社区干货传送门

TiDB 底层架构

不定期更新,记录一些小知识

TiDB 社区干货传送门

监控 版本升级 安装 & 部署

TiDB run and debug on M1

TiDB 社区干货传送门

实践案例 安装 & 部署

伴鱼数据库之SQL审核系统

TiDB 社区干货传送门

DeepMind推出Genie 3,一款文本到3D的交互式世界模型_生成式 AI_InfoQ精选文章