写点什么

微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家?开发者们:去他的吧!

  • 2025-02-21
    北京
  • 本文字数:3695 字

    阅读完需:约 12 分钟

大小:1.70M时长:09:54
微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家?开发者们:去他的吧!

整理 | 华卫、核子可乐


日前,微软在 Nature 杂志上发表了一项游戏生成式 AI 的突破性研究成果,其中介绍了其名为 “Muse”的世界和人类行为模型 (WHAM),可以生成游戏视觉效果及对应玩家操作的反应。在微软公告中概述的各项 Muse 用例当中,最有趣的当数游戏现代化机制——Muse 能够对经典游戏目录中的庞大作品储备进行研究,并针对现代硬件进行优化,展示出包括有机会通过新设备和新方式让未来一代的玩家玩到老游戏、增强创作者和玩家的能力、开创新可能性的潜力,目前他们正在 Copilot Labs 上提供简短的人工智能互动游戏体验。


然而,这一被称为“突破性”的技术进展,似乎却并不受游戏开发者和各大社区的青睐,许多人留言称“没人想要这个。”资深游戏开发者、开发工作室 The Outsiders 的创始人 David Goldfarb 甚至对其评价:“去他的这狗屎!”



Xbox 力推新游戏生成式 AI


据介绍,作为视频游戏人工智能生成模型,Muse 是同类中第一个在 Ninja Theory 的多人战斗竞技场游戏 Bleeding Edge 上训练的生成式 AI 模型,由 Microsoft Research 与总部同样位于英国剑桥的 Xbox Game Studios 的 Ninja Theory 合作开发。



Muse 的突破性之处在于它对 3D 游戏世界的全面了解,包括游戏物理学以及游戏对玩家控制器作的反应。这使该模型能够创建由 AI 渲染的一致且多样化的游戏玩法,向能够增强游戏创作者能力的生成式人工智能模型迈出了重要一步。


由 Muse(基于 WHAM-1.6B)生成的游戏序列示例表明,该模型可以生成在几分钟内保持一致的复杂游戏序列。以下显示的所有示例,都是通过向模型提示 10 个初始帧(1 秒)的人类游戏和整个游戏序列的控制器动作生成的。Muse 是在 “世界模型模式 ”下使用的,也就是说,它是用来预测游戏将如何从初始提示序列演变而来。生成的游戏序列与实际游戏的相似度越高,说明 Muse 对游戏动态的捕捉越准确。



微软 Xbox 团队称,尽管还为时尚早,但这项模型研究已突破其想象。如今,与老化硬件相联系的无数经典游戏已不再为大多数人所玩。得益于这一突破,他们正在探索 Muse 的潜力,它可以从我们的工作室获取较旧的旧目录游戏,并针对任何设备对其进行优化。“我们相信,这可能会从根本上改变我们未来保存和体验经典游戏的方式,让更多玩家能够使用它们。想象一下,随着时间的流逝和硬件的进步而消失在公众视野的旧日热门作品,将有一天可以在玩家的眼前再次焕发新生。对我们来说,这是个令人兴奋的可能性。”


Xbox 团队正在探索的另一个机会是 Muse 如何帮助游戏团队在创作过程中设计新的游戏体验原型,并引入新的内容——通过玩家已经喜爱的游戏,让开发人员为他们注入新的体验,甚至让其能够参与到创作过程中。他们已经在使用 Muse 开发一款“具备玩乐属性的实时 AI 模型”,其在微软第一方游戏之上进行训练。而生成式 AI 有望在游戏开发的某些环节中发挥作用。在原型设计阶段,开发人员可以创建游戏的基础和迭代版本,以便实现自己的想法并制定最终愿景。微软表示,“我们看到这项工作有朝一日可能会使玩家和游戏创作者都受益:从重振怀旧游戏到更快地进行创意构思。”


与此同时,为了帮助其他研究人员探索这一模型并在其工作基础上更进一步,Xbox 团队开放了 Muse 的权重和样本数据的来源,并为 WHAM 演示器提供了可执行文件——WHAM 演示器概念原型提供了与 WHAM 模型交互的可视化界面和多种提示模型的方法,开发人员可以在 Azure AI Foundry 上学习和实验权重、样本数据和 WHAM 演示器。


训练从一开始就让用户参与:相当于 7 年多“老玩家”


对于 Muse,最初 Microsoft Research 着手探索生成式 AI 模型如何支持新体验,重点是开发人工智能能力,使游戏开发人员能够以新的方式构思和扩展他们的作品。为了实现这一目标,他们采访了 27 位全球游戏创作者(从独立游戏公司到 AAA 级游戏工作室),以确保研究是由使用它的人来决定的。


据微软高级首席研究经理兼 Microsoft Research Game Intelligence 团队负责人 Katja Hofmann 介绍,从一开始他们就让用户参与了进来。其与高级首席研究经理 Cecily Morrison 带领的 Teachable AI Experiences 团队就这项工作的各个方面进行了几个月的讨论,并由 Cecily、设计研究员 Linda Wen 和首席研究软件开发工程师 Martin Grayson 推动,与游戏创作者们合作,调查这些游戏创作者希望如何在他们的创作实践中使用生成式人工智能功能。


Cecily 说:“这是一个很好的机会,我们可以在这个早期阶段联合起来,从一开始就塑造模型能力,以满足创作者的需求,而不是试图改造已经开发出来的技术。Linda 称,“我们已经看到技术驱动的 AI 创新经常让创作者措手不及,让许多人感到被排斥。这就是为什么我们从一开始就邀请游戏创作者来帮助我们塑造这项技术。我们认识到,大多数人工智能创新都是在全球北方地区开发的,因此我们还优先考虑招募来自代表性不足的背景和地区的游戏创作者。”



另据微软表示,在工作中他们还遇到了扩大模型训练规模等关键挑战。开始使用的是 V100 集群,在该集群上,他们能够证明如何在多达 100 个 GPU 上进行扩展训练;这最终为在 H100 上进行大规模训练铺平了道路。其早期做出的关键设计决定主要集中在如何更好地利用大型语言模型(LLM)社区的见解,包括如何有效地表示对应玩家控制器操作,尤其是图像等选择。


据了解,当前的 Muse 实例是根据 Xbox 游戏《Bleeding Edge》中的人类游戏数据(视觉效果和控制器动作)进行训练的。以下显示的是他们训练当前模型时采用的分辨率,为 300×180 px 。Muse(使用 WHAM-1.6B)已在超过 10 亿张图像和对应玩家控制器操作上进行了训练,相当于人类连续 7 年多的游戏时间。


遭开发商和一线开发者唱衰?


开发者和在线社区的普遍反应也非常迅速,但从结果来看对 Muse 的评价并不积极,甚至这项技术在从事游戏开发的一线制作者当中越来越受到抵制。面对 Muse 的发布,一位开发者回应称,“这类工具的涌现在为一部分人迅速赋能的同时,却根本不在乎对其他人造成的巨大冲击。”


资深游戏开发者、开发工作室 The Outsiders 的创始人 David Goldfarb 在一条发言中指出,他觉得生成式 AI 对于电子游戏没什么好处。“因为无论是有意为之还是无心之举,AI 背后的推动者实际上都是在削减资本支出,进而剥夺并贬低数百万游戏开发者和艺术家们所付出的汗水与心力。”Goldfarb 还提到,“主要问题在于,我们赖以生存的开发手艺正在消散。随着从业者越来越依赖 AI 技术,这类工具的涌现在为一部分人迅速赋能的同时,却根本不在乎对其他人造成的巨大冲击。”


根据此前 WIRED 发起的一项调查发现,AI 技术正将人类从业者剥离出电子游戏的创作流程;而与此同时,整个游戏行业也正在经历大规模收缩。过去几年间,成千上万的开发人员遭到解雇,且这一趋势将在 2025 年持续存在。虽然一部分开发者认为 AI 无法取代游戏中的纯创意部分,但多数从业人士仍然担心随着 AI 新工具的迅速发展,自己将无法在这个本就竞争激烈的行业当中继续生存。


微软的游戏部门似乎同样存在这种现象。一位 3A 游戏开发者(因未获准公开谈论 Muse 而要求保持匿名)透露,“Xbox 团队一边不断加大对生成式 AI 的投入,另一方面却无视开发人才流失的关键问题,属于典型的‘只见树木却不见森林’。他们没有意识到,开发者们根本就不想要什么 AI。但之所以计划还能推进得下去,就是因为大家不敢在内部讨论中表示反对,不敢在这个行业动荡的关键时期因成为‘出头鸟’而失去工作。”


另一家同样要求匿名的游戏开发商对此表示赞同,称他们同样担心反对 Muse 会影响到自己的工作和生计。“虽然只能匿名发言,但这种东西真的太恶心了。面对如今的游戏行业现状,特别是考虑到我们还得求着微软提供游戏出版许可,我实在不敢拿自己的身家性命来冒险。”这家开发商还提到,“在我看来,这种全面推广 AI 的模式绝不是为了帮助游戏开发者,而是想取悦股东,表明微软正在全力投入 AI。可与此同时,他们却只字不提 AI 从未开发出任何广受好评的游戏作品。”


英国游戏开发商 Creative Assembly 的开发总监 Marc Burrage 表示,即便有大模型的加持,计算机也无法在训练过程中获得与人类相同的知识。在 Burrage 看来,“原型设计既关注过程、也关注结果,必须亲身体验才能把握可玩性这个近乎玄学的概念。快速原型设计是一项宝贵的技能,哪怕是提前做好一切准备,也不存在百分百通往成功的捷径。”


在 Muse 的项目公告中,Xbox 团队方面称,“我们认为,最重要的是确保这波生成式 AI 技术突破,能够以协作且负责任的方式支持我们的行业和游戏创作社区。”而从实际反馈来看,微软要想说服游戏从业者们接下这张 AI 增效的“大饼”,还有很多工作要做。一位网友直言,“如果我们都失业了,没有人会买你的游戏。”



参考链接:


https://news.xbox.com/en-us/2025/02/19/muse-ai-xbox-empowering-creators-and-players/


https://www.microsoft.com/en-us/research/blog/introducing-muse-our-first-generative-ai-model-designed-for-gameplay-ideation/


https://www.wired.com/story/xbox-muse-generative-ai-developers-say-nobody-will-want-this/


声明:本文为 InfoQ AI 前线整理,不代表平台观点,未经许可禁止转载。

2025-02-21 14:558613

评论

发布
暂无评论

如何用一台电脑制作一部动画短片?

zhoo299

动画 CG

那些会阻碍程序员成长的细节[1]

MavenTalker

程序员 职业规划

Vol.4 了解一下渗透测试

pyfn2030

黑客 网络安全

说到做到

Yukun

拖延症

Dataway 配置数据接口时和前端进行参数对接

哈库纳

Spring Boot DataQL Dataway Hasor

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十)在项目中准备测试环境

编程道与术

Java 编程 软件测试 TDD 单元测试

代码简洁之路 [持续更新]

hq

Java 大前端 编程习惯

ARTS-WEEK01

子路无倦

ARTS 打卡计划

Dataway 整合 Swagger2,让 API 管理更顺畅

哈库纳

Spring Boot DataQL Dataway Hasor

自己常用的一些快捷键 windows10

halapano

Windows技巧

Vol.5 Go初探,新手必看!

pyfn2030

编程语言 新手指南

完美兼容老项目!Dataway 4.1.6 返回结构的全面控制

哈库纳

spring Spring Boot Dataway Hasor

Dataway 4.1.5 以上版本升级指南

哈库纳

string StringBoot Dataway Hasor

码农远程办公指北

大伟

【快点查查】微信小程序使用流程

tomatocc

艺术生,我劝你Mac

zhoo299

Mac CG 艺术

Vol.2 谷歌不只有搜索

pyfn2030

谷歌Google

从 0 到 1 搭建技术中台之技术文化篇

伴鱼技术团队

企业文化 技术管理

计算机的时间

伴鱼技术团队

分布式 服务器 技术交流

免费领课的活动你错过了么?

池建强

极客时间

Wi-Fi p2p & ap 共存

贾献华

wifi p2p ap

绝了!Dataway让Spring Boot不再需要Controller、Service、DAO、Mapper

哈库纳

StringBoot DataQL

《程序员的数学》笔记

Rex

读书笔记

Vol.6 几个数据库相关的词

pyfn2030

数据库 大数据 新手指南

Anaconda与虚拟环境

halapano

Python virtualenv Anaconda

Vol.3 人工智能这么热,你必须知道一点儿!

pyfn2030

人工智能

Gartner 【RPA市场竞争格局】:中国厂商首次进入国际视野

人称T客

AB 测试平台的设计与实现

伴鱼技术团队

架构 系统设计 后端 A/B

使用SpreadJS 开发在线问卷系统,构筑CCP(云数据采集)平台

葡萄城技术团队

数据挖掘 大数据 SpreadJS CCP

无需代码!通过 Dataway 配置一个带有分页查询的接口

哈库纳

spring springboot Dataway Hasor

系统服务化构建-两方OAuth

图南日晟

微服务 软件工程 身份认证 架构设计

微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家?开发者们:去他的吧!_AI&大模型_华卫_InfoQ精选文章