2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗

DeepMind 最新通用游戏 AI 智能体 SIMA 来了

  • 2024-03-20
    北京
  • 本文字数:3349 字

    阅读完需:约 11 分钟

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗

回想那些年,当 OpenAI Five 在 Dota 2 的战场上展现出超越人类的策略和协同,我们见证了 AI 在复杂游戏领域的惊人潜力。那时,围棋的神话已被 Alphago 刷新,但许多人仍将 AI 的成功视为特定领域的孤例。然而,历史正在翻篇。今天,DeepMind 带来了 SIMA——一种全新的通用游戏 AI 智能体,它不仅能够理解和执行自然语言指令,还能跨越多个 3D 虚拟世界自如行动。随着 SIMA 的问世,我们不禁要问:游戏的未来将被重新定义吗?


DeepMind 的通用游戏 AI 革命 -SIMA


DeepMind 最近公布了其在人工智能领域的一项重大进展:SIMA(Scalable Instructable Multiworld Agent),这是一种能够在多种 3D 虚拟环境中根据自然语言指令执行任务的通用 AI 智能体。DeepMind 与多家游戏开发商合作,在不同的电子游戏中训练了 SIMA,这标志着智能体首次能够广泛理解游戏世界,并能够像人类一样,根据自然语言指令执行虚拟环境中的任务。



DeepMind 表示,这项工作的目标不再仅仅是在游戏中获得高分。对于 AI 系统来说,学会玩电子游戏本身已经是一个技术壮举,但能够在多种游戏设置中遵循指令并理解环境设计的 AI 智能体则更具现实意义。


他们进一步解释说,这项研究展示了如何通过语言界面将高级 AI 模型的功能转化为具有实用性、能够匹配现实世界的操作。


为了让 SIMA 适应多种环境,DeepMind 与八家游戏工作室合作,在九款不同的电子游戏上训练并测试了 SIMA。这些游戏包括 Hello Games 的《无人深空》和 Tuxedo Labs 的《Teardown》。每款游戏都为 SIMA 提供了一个新的交互世界,包括从简单的导航和菜单使用到复杂的资源开采、飞船驾驶和头盔制作等一系列技能。


DeepMind 强调,SIMA 是一种 AI 智能体,能够感知并理解各种环境,然后采取行动以实现用户通过自然语言提出的目标。SIMA 包括一个为精确图像 - 语言映射而设计的模型,以及一个视频模型,用于预测屏幕上接下来可能发生的事件。


重要的是,SIMA 不需要访问游戏的源代码或特定 API,它仅需要两项输入:屏幕上的图像用户提供的简单自然语言指令


SIMA 会使用键盘和鼠标输出来控制游戏内的核心角色完成指令执行。由于这套简单的界面组合与人类使用场景相同,因此 SIMA 能够与任何虚拟环境进行交互。当前版本的 SIMA 已经接受了 600 项基本技能评估,涵盖导航(例如「左转」)、对象交互(「爬梯子」)、和菜单使用(「打开地图」)等操作。经过训练,SIMA 约在 10 秒内即可完成简单任务。


通过这项研究,DeepMind 展示了 SIMA 的跨游戏泛化能力,即在多种游戏环境中接受训练的 SIMA 智能体,其性能明显优于只在单一游戏中训练的智能体。研究证明,接受过多种游戏训练的智能体在质量上要远超单一游戏训练出的智能体。在 DeepMind 的评估中,SIMA 智能体在一组九款 3D 游戏上接受了训练,其表现明显优于仅在各单独游戏上进行训练的所有其他专用智能体。


更重要的是,平均来看在八款游戏上进行训练的智能体,在余下一款游戏中的表现同仅在该游戏上训练的智能体几乎水平相当。而这种在全新环境下发挥作用的能力,也凸显出 SIMA 超越其训练环境的强大泛化能力。


目前的初步结果令他们感到欣喜,但 SIMA 还需要更多研究才能在已接触过还尚未接触过的游戏中达到人类玩家的水平。


DeepMind 也谈到,SIMA 的表现依赖于语言指导。在控制测试中,智能体在不接受任何语言训练或指令引导时,就会出现漫无目的、原地打转的情况。同时他们也评估了 SIMA 依照指令完成近 1500 个游戏内不同任务的能力,其中部分任务有人类玩家的协助。


DeepMind 表示,SIMA 的成功展示了通过电子游戏作为测试平台,AI 技术如何帮助人类解决实际问题的巨大潜力。他们希望通过进一步的研究,使 SIMA 能够理解更复杂的指令并执行更多高级任务,最终实现更具通用性和实用性的 AI 系统。


总的来说来说,SIMA 就像是一个能够听懂人类指令并在多个视频游戏世界中执行这些指令的超级游戏玩家。这项研究展示了 AI 技术在理解和执行复杂任务方面的巨大潜力。


SIMA 的能力展示:重塑游戏 AI 的未来


从他们的介绍中,可以窥探,未来的 SIMA 一定会拥有以下“超能力了”。


首先它提高游戏 AI 的质量:通过使用类似 SIMA 的 AI 代理,游戏开发者可以创建出更加智能和适应性强的游戏 AI,这些 AI 能够更自然地与玩家互动,提供更具挑战性和多样性的游戏体验。这种 AI 能够根据自然语言指令执行复杂任务,可能会让游戏世界的 NPC(非玩家角色)行为更加真实和有趣。


其次,它能够加速游戏测试和开发:SIMA 展示了在多种游戏环境中遵循自然语言指令的能力,这意味着它可以被用作自动化测试工具,帮助开发者快速识别游戏中的问题或不足。自动化测试可以提高开发效率,减少重复性工作,使开发团队能够专注于创造性任务。


当然,SIMA 一定会促进游戏设计的创新:SIMA 的研究强调了 AI 和自然语言处理技术在游戏设计中的潜力。开发者可能会受到启发,探索新的游戏机制和故事叙述方法,其中玩家可以通过自然语言与游戏世界互动。这可能会开启全新的游戏类型,其中玩家与游戏世界的交互更加直观和富有沉浸感。


跨游戏学习和适应能力:SIMA 在多个游戏中的表现突出了 AI 的跨游戏学习能力,这对于开发多样化游戏内容的开发者来说是一个重要的里程碑。这种能力意味着 AI 可以在一个游戏中学到的技能和知识转移到另一个游戏中,为开发跨游戏平台或系列游戏提供了新的可能性。


社区反响:玩家和开发者对 SIMA Or Game 的看法


在 Hacker news 的评论区,大家就这个新闻表达了相当高的关注,许多人的焦点是在人工智能的能力、它们与人类玩家的比较,以及 AI 技术的进步是否被过度夸大等。



“我永远不会忘记在 Dota 2017 年的比赛上,OpenAI 展示了一个能够挑战职业 Dota 玩家的 AI。Dota 是一个极其复杂和困难的游戏。这对我来说是一个令人大开眼界的时刻”。- 译


有人分享了 OpenAI 在 Dota 游戏中对抗职业玩家并取得胜利的例子,这被视为 AI 技术的一个重要进展。然而,也有批评声音指出,这些成就并不意味着 AI 已经能够完全理解或在未见过的游戏中表现得像人类那样。


例如,在 Dota 的例子中,为了让 AI 能够参与比赛,游戏的范围被大幅缩减,AI 只需要理解 10 个英雄在两种特定的 5 人组合中的表现,而通常情况下,游戏中有 100 多个英雄可以以任何排列组合选择,某些游戏机制也被限制只对人类玩家使用,因为 AI 无法理解它们。这表明,尽管 AI 在某些受限环境中的表现令人印象深刻,但它们在泛化能力和处理完整游戏版本方面仍然存在巨大差距。



同时也有人持沮丧的观点,认为这对于大型多人在线角色扮演游戏(MMORPG)来说,无疑是一声丧钟。因为以后在这些游戏中都是机器人 AI。。



“我希望开发者能利用这项技术为 NPC 注入更多生命力。很多时候,我们被告知角色扮演游戏中的 NPC 将拥有自己的生活,独立于玩家做自己的事情等等,但这些承诺从未真正实现过任何值得注意的成果。然而,有了 AI 技术,我觉得我们可能正在接近这个目标。”-译


有的网友则表示非支持,SIMA 的出现或许可以给 NPC 赋予更多生命力的期待。然而,一些评论者对于这种技术进步是否真的能使游戏变得更有趣表示怀疑,担心过度追求 NPC 的真实性可能会导致不好的效应,或者增加游戏的摩擦,从而降低游戏体验的乐趣。尽管存在这样的担忧,也有人对未来持乐观态度,认为开发者将找到使用 AI 创造有趣游戏的方法。


从其他的讨论中还看到了,有些人觉得游戏并不需要过分追求现实主义才能变得更好,游戏是现实生活的一种简化或夸张,旨在提供良好的体验而非模仿现实。尽管存在挑战,但许多人相信,随着 AI 技术的进步,游戏开发者将能够创造出新类型的游戏,其中 NPC 的不可预测性和更复杂的行为将成为核心机制,从而为玩家提供全新的游戏体验。



还有些肯定者的评价,这位网友指出 SIMA 代理在接受了九款 3D 游戏集合的训练后,其表现显著超过了仅在单个游戏上训练的专门代理。更令人惊讶的是,即便是在未曾见过的游戏中,经过 N-1 游戏训练的代理也能达到与专门训练代理相近的水平。这一发现挑战了许多人的预期,即 AI 的成功往往被认为是因为训练集中包含了特定的数据,而忽视了算法本身的转移学习能力。


对于 SIMA 或者游戏未来,你有什么想说的?欢迎评论区留下你的建议。


参考链接:


https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/


https://news.ycombinator.com/item?id=39692387

2024-03-20 18:597642

评论

发布
暂无评论
发现更多内容

《MySQL入门很轻松》第4章:数据表的创建修改删除

乌龟哥哥

7月月更

Python|揭开「pip不是内部或外部命令,也不是可运行的程序或批处理文件」的神秘面纱

AXYZdong

Python 7月月更

ORACLE进阶(十一)MERGE INTO学习总结

No Silver Bullet

oracle MERGE INTO 7月月更

图解网络:什么是DHCP动态主机配置协议?

wljslmz

网络协议 DHCP 网络技术 7月月更

内部排序——归并排序

乔乔

7月月更

Ark UI中的问题汇总【系列1】

坚果

Open HarmonyOS OpenHarmony Open Harmony 7月月更

Spring Cloud源码分析之Eureka篇第七章:续约

程序员欣宸

Java Spring Cloud Eureka 7月月更

数据库每日一题---第21天:员工花费的总时间

知心宝贝

数据库 云计算 后端 开发 7月月更

QT 实现生成压缩包

小肉球

qt 7月月更

关于 HTTP post 请求 form data 里的特殊符号,比如加号 plus symbol

汪子熙

HTTP web开发 7月月更 encoding form

Jenkins centOS搭建和task创建

沃德

ci 程序员 7月月更

闭包

Jason199

js 闭包要点 闭包函数 7月月更

【Python技能树共建】python selectolax 模块 & Python爬虫模拟登录

梦想橡皮擦

Python 爬虫 7月月更

Python Asyncio 初探:基本概念和模式

宇宙之一粟

Python asyncio 7月月更

OKALEIDO:我们为何如此看好多媒体NFT板块?

鳄鱼视界

如果设计业务微服务架构 - 作业

阿拉阿拉幽幽

OKALEIDO:我们为何如此看好多媒体NFT板块?

股市老人

电商系统微服务架构

泋清

#架构实战营

前端异常监控平台对比

南城FE

前端 7月月更 异常监控

ORACLE进阶(十二)union(all)学习总结

No Silver Bullet

oracle 7月月更 union union all

新星计划Day3【JavaSE】 集合 Part1

京与旧铺

7月月更

leetcode 932. Beautiful Array 漂亮数组(中等)

okokabcd

LeetCode 分治 算法与数据结构

spring篇之属性注入

邱学喆

spring 属性注入 @Autowired注入原理 @Resource注入原理 @Qualifier

Python反爬,JS反爬串讲,从MAOX眼X开始,本文优先解决反爬参数 signKey

梦想橡皮擦

Python 爬虫 7月月更

14岁懂社会 - 《你没有那么笨》读书笔记

懒时小窝

读书笔记 14岁懂社会

【C语言深度剖析】详解strlen与sizeof的区别及用法

Albert Edison

7月月更

人最痛苦的时候就是没有目标的时候

KEY.L

7月月更

【愚公系列】2022年07月 Java教学课程 02-Java语言JRE和JDK

愚公搬代码

7月月更

拆分电商系统为微服务

爱晒太阳的大白

架构实战营模块六作业

Geek_Q

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗_AI&大模型_李忠良_InfoQ精选文章