2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家?开发者们:去他的吧!

  • 2025-02-21
    北京
  • 本文字数:3695 字

    阅读完需:约 12 分钟

大小:1.70M时长:09:54
微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家?开发者们:去他的吧!

整理 | 华卫、核子可乐


日前,微软在 Nature 杂志上发表了一项游戏生成式 AI 的突破性研究成果,其中介绍了其名为 “Muse”的世界和人类行为模型 (WHAM),可以生成游戏视觉效果及对应玩家操作的反应。在微软公告中概述的各项 Muse 用例当中,最有趣的当数游戏现代化机制——Muse 能够对经典游戏目录中的庞大作品储备进行研究,并针对现代硬件进行优化,展示出包括有机会通过新设备和新方式让未来一代的玩家玩到老游戏、增强创作者和玩家的能力、开创新可能性的潜力,目前他们正在 Copilot Labs 上提供简短的人工智能互动游戏体验。


然而,这一被称为“突破性”的技术进展,似乎却并不受游戏开发者和各大社区的青睐,许多人留言称“没人想要这个。”资深游戏开发者、开发工作室 The Outsiders 的创始人 David Goldfarb 甚至对其评价:“去他的这狗屎!”



Xbox 力推新游戏生成式 AI


据介绍,作为视频游戏人工智能生成模型,Muse 是同类中第一个在 Ninja Theory 的多人战斗竞技场游戏 Bleeding Edge 上训练的生成式 AI 模型,由 Microsoft Research 与总部同样位于英国剑桥的 Xbox Game Studios 的 Ninja Theory 合作开发。



Muse 的突破性之处在于它对 3D 游戏世界的全面了解,包括游戏物理学以及游戏对玩家控制器作的反应。这使该模型能够创建由 AI 渲染的一致且多样化的游戏玩法,向能够增强游戏创作者能力的生成式人工智能模型迈出了重要一步。


由 Muse(基于 WHAM-1.6B)生成的游戏序列示例表明,该模型可以生成在几分钟内保持一致的复杂游戏序列。以下显示的所有示例,都是通过向模型提示 10 个初始帧(1 秒)的人类游戏和整个游戏序列的控制器动作生成的。Muse 是在 “世界模型模式 ”下使用的,也就是说,它是用来预测游戏将如何从初始提示序列演变而来。生成的游戏序列与实际游戏的相似度越高,说明 Muse 对游戏动态的捕捉越准确。



微软 Xbox 团队称,尽管还为时尚早,但这项模型研究已突破其想象。如今,与老化硬件相联系的无数经典游戏已不再为大多数人所玩。得益于这一突破,他们正在探索 Muse 的潜力,它可以从我们的工作室获取较旧的旧目录游戏,并针对任何设备对其进行优化。“我们相信,这可能会从根本上改变我们未来保存和体验经典游戏的方式,让更多玩家能够使用它们。想象一下,随着时间的流逝和硬件的进步而消失在公众视野的旧日热门作品,将有一天可以在玩家的眼前再次焕发新生。对我们来说,这是个令人兴奋的可能性。”


Xbox 团队正在探索的另一个机会是 Muse 如何帮助游戏团队在创作过程中设计新的游戏体验原型,并引入新的内容——通过玩家已经喜爱的游戏,让开发人员为他们注入新的体验,甚至让其能够参与到创作过程中。他们已经在使用 Muse 开发一款“具备玩乐属性的实时 AI 模型”,其在微软第一方游戏之上进行训练。而生成式 AI 有望在游戏开发的某些环节中发挥作用。在原型设计阶段,开发人员可以创建游戏的基础和迭代版本,以便实现自己的想法并制定最终愿景。微软表示,“我们看到这项工作有朝一日可能会使玩家和游戏创作者都受益:从重振怀旧游戏到更快地进行创意构思。”


与此同时,为了帮助其他研究人员探索这一模型并在其工作基础上更进一步,Xbox 团队开放了 Muse 的权重和样本数据的来源,并为 WHAM 演示器提供了可执行文件——WHAM 演示器概念原型提供了与 WHAM 模型交互的可视化界面和多种提示模型的方法,开发人员可以在 Azure AI Foundry 上学习和实验权重、样本数据和 WHAM 演示器。


训练从一开始就让用户参与:相当于 7 年多“老玩家”


对于 Muse,最初 Microsoft Research 着手探索生成式 AI 模型如何支持新体验,重点是开发人工智能能力,使游戏开发人员能够以新的方式构思和扩展他们的作品。为了实现这一目标,他们采访了 27 位全球游戏创作者(从独立游戏公司到 AAA 级游戏工作室),以确保研究是由使用它的人来决定的。


据微软高级首席研究经理兼 Microsoft Research Game Intelligence 团队负责人 Katja Hofmann 介绍,从一开始他们就让用户参与了进来。其与高级首席研究经理 Cecily Morrison 带领的 Teachable AI Experiences 团队就这项工作的各个方面进行了几个月的讨论,并由 Cecily、设计研究员 Linda Wen 和首席研究软件开发工程师 Martin Grayson 推动,与游戏创作者们合作,调查这些游戏创作者希望如何在他们的创作实践中使用生成式人工智能功能。


Cecily 说:“这是一个很好的机会,我们可以在这个早期阶段联合起来,从一开始就塑造模型能力,以满足创作者的需求,而不是试图改造已经开发出来的技术。Linda 称,“我们已经看到技术驱动的 AI 创新经常让创作者措手不及,让许多人感到被排斥。这就是为什么我们从一开始就邀请游戏创作者来帮助我们塑造这项技术。我们认识到,大多数人工智能创新都是在全球北方地区开发的,因此我们还优先考虑招募来自代表性不足的背景和地区的游戏创作者。”



另据微软表示,在工作中他们还遇到了扩大模型训练规模等关键挑战。开始使用的是 V100 集群,在该集群上,他们能够证明如何在多达 100 个 GPU 上进行扩展训练;这最终为在 H100 上进行大规模训练铺平了道路。其早期做出的关键设计决定主要集中在如何更好地利用大型语言模型(LLM)社区的见解,包括如何有效地表示对应玩家控制器操作,尤其是图像等选择。


据了解,当前的 Muse 实例是根据 Xbox 游戏《Bleeding Edge》中的人类游戏数据(视觉效果和控制器动作)进行训练的。以下显示的是他们训练当前模型时采用的分辨率,为 300×180 px 。Muse(使用 WHAM-1.6B)已在超过 10 亿张图像和对应玩家控制器操作上进行了训练,相当于人类连续 7 年多的游戏时间。


遭开发商和一线开发者唱衰?


开发者和在线社区的普遍反应也非常迅速,但从结果来看对 Muse 的评价并不积极,甚至这项技术在从事游戏开发的一线制作者当中越来越受到抵制。面对 Muse 的发布,一位开发者回应称,“这类工具的涌现在为一部分人迅速赋能的同时,却根本不在乎对其他人造成的巨大冲击。”


资深游戏开发者、开发工作室 The Outsiders 的创始人 David Goldfarb 在一条发言中指出,他觉得生成式 AI 对于电子游戏没什么好处。“因为无论是有意为之还是无心之举,AI 背后的推动者实际上都是在削减资本支出,进而剥夺并贬低数百万游戏开发者和艺术家们所付出的汗水与心力。”Goldfarb 还提到,“主要问题在于,我们赖以生存的开发手艺正在消散。随着从业者越来越依赖 AI 技术,这类工具的涌现在为一部分人迅速赋能的同时,却根本不在乎对其他人造成的巨大冲击。”


根据此前 WIRED 发起的一项调查发现,AI 技术正将人类从业者剥离出电子游戏的创作流程;而与此同时,整个游戏行业也正在经历大规模收缩。过去几年间,成千上万的开发人员遭到解雇,且这一趋势将在 2025 年持续存在。虽然一部分开发者认为 AI 无法取代游戏中的纯创意部分,但多数从业人士仍然担心随着 AI 新工具的迅速发展,自己将无法在这个本就竞争激烈的行业当中继续生存。


微软的游戏部门似乎同样存在这种现象。一位 3A 游戏开发者(因未获准公开谈论 Muse 而要求保持匿名)透露,“Xbox 团队一边不断加大对生成式 AI 的投入,另一方面却无视开发人才流失的关键问题,属于典型的‘只见树木却不见森林’。他们没有意识到,开发者们根本就不想要什么 AI。但之所以计划还能推进得下去,就是因为大家不敢在内部讨论中表示反对,不敢在这个行业动荡的关键时期因成为‘出头鸟’而失去工作。”


另一家同样要求匿名的游戏开发商对此表示赞同,称他们同样担心反对 Muse 会影响到自己的工作和生计。“虽然只能匿名发言,但这种东西真的太恶心了。面对如今的游戏行业现状,特别是考虑到我们还得求着微软提供游戏出版许可,我实在不敢拿自己的身家性命来冒险。”这家开发商还提到,“在我看来,这种全面推广 AI 的模式绝不是为了帮助游戏开发者,而是想取悦股东,表明微软正在全力投入 AI。可与此同时,他们却只字不提 AI 从未开发出任何广受好评的游戏作品。”


英国游戏开发商 Creative Assembly 的开发总监 Marc Burrage 表示,即便有大模型的加持,计算机也无法在训练过程中获得与人类相同的知识。在 Burrage 看来,“原型设计既关注过程、也关注结果,必须亲身体验才能把握可玩性这个近乎玄学的概念。快速原型设计是一项宝贵的技能,哪怕是提前做好一切准备,也不存在百分百通往成功的捷径。”


在 Muse 的项目公告中,Xbox 团队方面称,“我们认为,最重要的是确保这波生成式 AI 技术突破,能够以协作且负责任的方式支持我们的行业和游戏创作社区。”而从实际反馈来看,微软要想说服游戏从业者们接下这张 AI 增效的“大饼”,还有很多工作要做。一位网友直言,“如果我们都失业了,没有人会买你的游戏。”



参考链接:


https://news.xbox.com/en-us/2025/02/19/muse-ai-xbox-empowering-creators-and-players/


https://www.microsoft.com/en-us/research/blog/introducing-muse-our-first-generative-ai-model-designed-for-gameplay-ideation/


https://www.wired.com/story/xbox-muse-generative-ai-developers-say-nobody-will-want-this/


声明:本文为 InfoQ AI 前线整理,不代表平台观点,未经许可禁止转载。

2025-02-21 14:558689

评论

发布
暂无评论

超详细讲解!Android面试真题解析火爆全网,搞懂这些直接来阿里入职

欢喜学安卓

android 编程 程序员 面试 移动开发

新思科技最新报告显示开源安全是首要考虑因素

InfoQ_434670063458

《数据结构与抽象:Java语言描述》.pdf

田维常

数据结构

恕我直言!有了这份MySQL学习文档,你收藏夹里的其他MySQL学习资料都可以扔了

Java架构之路

Java 程序员 架构 面试 编程语言

还有谁比阿里人更懂SpringCloud Alibaba 呢?P8大牛纯手打笔记免费分享!

Java架构之路

Java 程序员 架构 面试 编程语言

Mybatis动态映射,so easy啦

田维常

区分Protobuf 3中缺失值和默认值

Gopher指北

protobuf Go 语言

阿里架构师经验分享!啃完999页Android面试高频宝典,面试心得体会

欢喜学安卓

android 程序员 面试 移动开发

智慧警务开发,二维码定位报警系统搭建

t13823115967

智慧公安 智慧公安扫码

某美女的程序员老公半夜都还不回家,原来是偷偷在公司看Redis+JVM+Spring cloud+MySQL技术文档

Java架构之路

Java 程序员 架构 面试 编程语言

助力孩子走上学霸之路,K12学习神器现已面世!

E科讯

港美股交易系统开发框架构造简述篇

软件开发大鱼V15988750073

国际配售 港股交易系统开发 证券交易系统 资管系统 港股打新系统

JS&Swift

ios swift

用60行代码实现一个高性能的圣诞抽抽乐H5小游戏(含源码)

徐小夕

Java 大前端 H5游戏 H5

EPBC环保生态链系统开发案例丨环保生态链EPBC源码平台

系统开发咨询1357O98O718

环保链APP系统开发案例

区块链BaaS应用平台开发

13828808769

iOS面试基础知识 (一)

iOSer

ios 面试 runtime 编程开发 iOS Developer

Scala中String和Int隐式转换的问题分析

木子李G

scala 大数据 编程 隐式转换

DolphinDB与Elasticserach在金融数据集上的性能对比测试

DolphinDB

数据处理 金融 时序数据库 tsdb DolphinDB

Github 2020 年度报告:你以为新冠击溃了开发者?不!他们创造了更多代码...

阿里巴巴云原生

开源 Serverless 程序员 代码

区块链信息共享应用落地搭建解决方案

t13823115967

区块链+ 区块链应用 信息共享

刚拿到蚂蚁金服架构师offer!大佬教你如何成为offer收割机

比伯

Java 编程 架构 面试 计算机

四币连发平台系统开发详解丨四币连发源码(案例)

系统开发咨询1357O98O718

四币连发系统开发案例详解

SGY奇点交易所系统软件开发|SGY奇点交易所APP开发

系统开发

仅凭这份Java大纲笔记,我如愿拿到了阿里offer。

Java架构之路

Java 程序员 架构 面试 编程语言

请问如何短时间突击 Java 通过面试?

Java架构师迁哥

SGY奇点交易所系统软件APP开发

系统开发

DeFi流动性挖矿系统开发(案例源码开发)

系统开发咨询1357O98O718

defi流动性挖矿系统开发

四面腾讯pcg后端开发岗,一个星期面完成功拿到20K的offer。分享面经

Java架构之路

Java 程序员 架构 面试 编程语言

服务于阿里、滴滴、华为等一线互联网公司的分布式消息中间件RocketMQ核心笔记

Java架构追梦

Java 架构 面试 RocketMQ 消息中间件

了解OAuth2.0

环信

微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家?开发者们:去他的吧!_AI&大模型_华卫_InfoQ精选文章