写点什么

巫师 3、茶杯头、赛博朋克 2077 都能玩:英伟达把会打 1000 多款游戏的大模型全开源了

  • 2025-12-23
    北京
  • 本文字数:848 字

    阅读完需:约 3 分钟

大小:414.11K时长:02:21
巫师3、茶杯头、赛博朋克2077都能玩:英伟达把会打1000多款游戏的大模型全开源了

NVIDIA 研究团队近日开源发布了 NitroGen——一个以“玩游戏”为核心训练目标的基础模型,覆盖 1000 多款不同类型的游戏,包括 RPG、平台跳跃、吃鸡、赛车,以及 2D / 3D 等多种形态。



但其目标并非打造“更强的游戏 AI”,而是探索一种更具普适性的具身智能训练范式:在大规模模拟环境中,学习跨物理规则的通用运动控制能力。

 

研究团队发现,最初为机器人场景设计的 GR00T N1.5 架构,在几乎不做结构性修改的情况下,就可以迁移到游戏环境中,并适配机制差异极大的任务。这一结果再次验证了“苦涩教训(Bitter Lesson)”在具身智能领域的有效性:

一、一个 4 万+ 小时、高质量、来自真实世界的公开视频游戏数据集;

二、一个用于连续运动控制、能力极强的基础模型;

三、一个 Gym API,可以把任何游戏二进制程序封装起来跑 rollout。

 

其中,数据集本身也是 NitroGen 的关键底座之一:该数据集规模庞大且种类繁多——包含 800 多款游戏,每款游戏的数据时长均超过 1 小时;另有 15 款游戏的数据时长均超过 1000 小时。游戏类型涵盖动作角色扮演、平台跳跃、动作冒险、体育、类银河战士恶魔城、Roguelike 等。

 

在数据构建层面,团队采用了一种颇具工程巧思的方法。大量游戏玩家会在视频中叠加实时手柄输入,用于展示操作技巧。研究人员训练了一个分割模型,自动识别并提取这些手柄显示区域,将其转化为“专家级动作标签”;同时对该区域进行遮挡,避免模型通过视觉捷径“作弊”。在此基础上,GR00T N1.5 的一个变体通过 Diffusion Transformer,直接学习从像素到动作的映射关系。


https://nitrogen.minedojo.org/


值得注意的是,NitroGen 完全开源:包括预训练权重、完整动作数据集、训练与推理代码,以及一份技术细节充分的白皮书。

 

在更宏观的视角下,研究者提出了一个颇具挑衅意味的判断:“今天,机器人学几乎是所有困难 AI 问题的‘超集’;明天,它可能只是具身 AGI 巨大潜在空间中的一个子集。 ”

 

如果这一判断成立,未来的机器人控制,或许将不再是手工设计的系统工程,而更像是一次“prompt”:按需生成、即取即用。


2025-12-23 11:514

评论

发布
暂无评论

规模之大刷新世界纪录,Cloudflare成功抵御3.8Tbps的DDoS攻击

网络安全服务

udp 端口 web服务器 Cloudflare DDoS 攻击

打造一站式应用内支付体验,助力开发者商业增长

HarmonyOS SDK

HarmonyOS

简化部署流程:Rainbond让Jeepay支付系统部署更轻松

北京好雨科技有限公司

Kubernetes 云原生 rainbond 企业号10月PK榜

哭晕,腾讯的面试太难了。。。

王中阳Go

Go 面试 后端

2024-10-08:用go语言,给定一个字符串 word 和一个整数 k,判断是否可以通过删除最少数量的字符使得该字符串成为 k 特殊字符串。 其中,k 特殊字符串满足字符串中任意两个字符的出现频率

福大大架构师每日一题

福大大架构师每日一题

SD-WAN怎样满足企业网络的需求

Ogcloud

SD-WAN SD-WAN组网 SD-WAN服务商 SDWAN SD-WAN国际专线

HelixFold 3 全球首个完整复现 AlphaFold 3,百度智能云 CHPC 为人类生命探索提供算力平台支撑

百度Geek说

百度 大数据‘’ 算法、

C++函数指针详解

不在线第一只蜗牛

Java c++ JVM

很好也很贵?OpenAI Realtime API 一手体验和 Voice AI 的未来 |播客《编码人声》

RTE开发者社区

教程:免费调用老黄历API

幂简集成

API

简单几步!我用豆包MarsCode 画数据大屏

TRAE.ai

程序员 AI 开发 项目

NL2SQL之DB-GPT-Hub<详解篇>:text2sql任务的微调框架和基准对比

汀丶人工智能

NL2SQL

亚马逊国际商品详情API返回值:电商精准营销的关键

技术冰糖葫芦

API Gateway API 接口 API 文档 API 测试 pinduoduo API

DApp智能合约开发:交易平台定制化与系统成品开发

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 公链开发

软件测试学习笔记丨allure学习指南

测试人

软件测试

高效开发Maven架构设计图解/掌握项目工程自动化技巧(精通篇三)

肖哥弹架构

maven 效能

用AI构建小程序可行吗?

FinFish

AI技术 小程序容器 小程序开发 AI开发小程序 前端页面开发

筑梦山野 | 闪迪助力野居青年记录理想生活

极客天地

RAG系统评测实践详细版:Coze及相关产品评测对比,以及下一代RAG技术

汀丶人工智能

rag

语音生成公司 ElevenLabs 估值达 30 亿美元;OpenAI Realtime API 很好也很贵丨RTE 开发者日报

RTE开发者社区

巫师3、茶杯头、赛博朋克2077都能玩:英伟达把会打1000多款游戏的大模型全开源了_生成式 AI_Tina_InfoQ精选文章