2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

DeepMind 推出 Genie 3,一款文本到 3D 的交互式世界模型

作者:Daniel Dominguez

  • 2025-08-19
    北京
  • 本文字数:906 字

    阅读完需:约 3 分钟

大小:440.69K时长:02:30
DeepMind推出Genie 3,一款文本到3D的交互式世界模型

DeepMind 推出了Genie 3,这是其世界模型框架的最新版本,用于直接从文本提示生成交互式 3D 环境。该系统在 720p 分辨率下以大约每秒 24 帧的速度实时渲染场景,允许连续导航和交互数分钟而无需重置场景。与早期版本相比,它的核心改进之一是对象持久性:对环境所做的任何更改,如移动、删除或更改对象,都会随着时间的推移保持持久性。该模型还保持了一致的物理特性,无需使用单独的内存模块,而是依赖于学习到的世界动态。

 

Genie 3将这些工具的各个方面整合到一个单一的生成管道中。它既可以作为一个从自然语言产生独特环境的内容创建系统,也可以作为一个测试自主代理的仿真平台。该模型可以完全从文本中创建各种设置,如室内工业布局、室外自然地形或复杂的障碍路线。这种灵活性使其适合于训练场景的快速原型设计,特别是在机器人和具身智能领域,多样化和动态的世界对开发可泛化的技能至关重要。

 

该方法将 Genie 3 与其他生成式 AI 系统区别开来。例如,OpenAI 的Sora可以从文本描述中产生高度逼真的视频,但仅限于固定长度的剪辑,不支持实时交互。Meta 的Habitat专注于具身智能研究,为智能体提供高保真的 3D 空间,用于导航和操纵任务。然而,Habitat 需要预定义的场景和资产,而不是从提示中程序化地生成它们。NVIDIA 的Isaac Sim提供了先进的机器人仿真功能,具有详细的传感器建模和物理特性,但同样依赖于手动构建或导入的环境。基于《我的世界》(Minecraft)构建的MineDojo允许 AI 智能体在程序生成的世界中操作,但其机制和基于方块的视觉效果限制了现实感和物理准确性。

 

Reddit 用户在r/singularity 上分享了一些关于 Genie 3 的看法,其中一位用户评论道:

 

想象一下,过去几年你一直与世隔绝,然后突然看到了这个。这简直就像科幻小说里的情节,像是《星际迷航》里的东西。

 

而另一位用户评论道:

 

现在把这个接入虚拟现实(VR),基本上就是元宇宙了。

 

虽然传统的模拟引擎如Unreal EngineUnity等也支持自定义环境,但它们通常需要资源库和手动场景组装。Genie 3 则通过按需生成环境绕过了这一步骤,不过与专用游戏引擎相比,其当前的局限性包括运行持续时间和环境复杂性。

 

原文链接:

https://www.infoq.com/news/2025/08/deepmind-genie-virtual/

2025-08-19 12:004350

评论

发布
暂无评论

关于线程池,面试的时候你时候还打怵,这里我有话要说保证让你对线程池的各个参数一边就懂

派大星

线程池

Spring Boot 整合Dubbo + Zookeeper 实现分布式 消费者与服务者的业务调用

Bug终结者

Java dubbo springboot

mysql的FIND_IN_SET group_concat 函数

Rubble

MySQL 4月日更

明道云如何实现银行内部评级管理

明道云

MapReduce 学习思考

en

mapreduce

剑指Offer之面试题57: 和为s的数字

宇宙之一粟

算法刷题 4月月更 剑指Offer

让页面跳转更有趣 —— 实现自定义页面切换转场动画

岛上码农

flutter 移动端开发 4月月更 跨平台开发 安卓 ios

作业七

Geek_f3e842

架构实战营

云原生时代如何用 Prometheus 实现性能压测可观测-Metrics 篇

阿里巴巴云原生

通过npm+Vant Weapp 构建微信小程序

kcnf

Bigdata作业 第五周

Pyel

WEB3的DAO生态服务平台,SeekTiger展现新的契机

小哈区块

大话后端开发的奇技淫巧大集合

SFLYQ

架构 Web 后端 服务端 经验分享

Rust的对象安全性

Shine

rust

【图解数据结构】栈全面总结

知心宝贝

c++ 数据结构 算法 4月月更

架构实战营毕业总结(第 5 期)

唐尤华

架构实战营

分布式链路追踪

yuexin_tech

链路追踪

通达快递系统设计

peter

Linux驱动开发-安装驱动参数传递

DS小龙哥

4月月更

通达系统架构设计文档

小锅米线

[Day6]-[动态规划] 俄罗斯套娃

方勇(gopher)

LeetCode 数据结构和算法

Linux之ssh-add命令

入门小站

聊聊最近比较火的一款Web3.0应用(25/100)

hackstoic

区块链 gamefi Web3.0 stepn Play2Earn

兑现 Service Mesh 的新价值:精确控制“爆炸半径”

阿里巴巴云原生

RocketMQ—Producer(二)路由动态更新

IT巅峰技术

Apache RocketMQ

Spring容器的核心组件

IT巅峰技术

Spinner: 往Pinterest新工作流平台的大规模迁移

俞凡

架构 工作流引擎 大厂实践 Pinterest

Kubernetes官方java客户端之七:patch操作

程序员欣宸

4月月更

阿里云OSS图床搭建

懒时小窝

阿里云 OSS 图床

读《A Philosophy of Software Design》(01-07)

术子米德

架构师成长笔记

Spring容器的灵魂

IT巅峰技术

Spring 框架漏洞

DeepMind推出Genie 3,一款文本到3D的交互式世界模型_生成式 AI_InfoQ精选文章