阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗

DeepMind 最新通用游戏 AI 智能体 SIMA 来了

  • 2024-03-20
    北京
  • 本文字数:3349 字

    阅读完需:约 11 分钟

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗

回想那些年,当 OpenAI Five 在 Dota 2 的战场上展现出超越人类的策略和协同,我们见证了 AI 在复杂游戏领域的惊人潜力。那时,围棋的神话已被 Alphago 刷新,但许多人仍将 AI 的成功视为特定领域的孤例。然而,历史正在翻篇。今天,DeepMind 带来了 SIMA——一种全新的通用游戏 AI 智能体,它不仅能够理解和执行自然语言指令,还能跨越多个 3D 虚拟世界自如行动。随着 SIMA 的问世,我们不禁要问:游戏的未来将被重新定义吗?


DeepMind 的通用游戏 AI 革命 -SIMA


DeepMind 最近公布了其在人工智能领域的一项重大进展:SIMA(Scalable Instructable Multiworld Agent),这是一种能够在多种 3D 虚拟环境中根据自然语言指令执行任务的通用 AI 智能体。DeepMind 与多家游戏开发商合作,在不同的电子游戏中训练了 SIMA,这标志着智能体首次能够广泛理解游戏世界,并能够像人类一样,根据自然语言指令执行虚拟环境中的任务。



DeepMind 表示,这项工作的目标不再仅仅是在游戏中获得高分。对于 AI 系统来说,学会玩电子游戏本身已经是一个技术壮举,但能够在多种游戏设置中遵循指令并理解环境设计的 AI 智能体则更具现实意义。


他们进一步解释说,这项研究展示了如何通过语言界面将高级 AI 模型的功能转化为具有实用性、能够匹配现实世界的操作。


为了让 SIMA 适应多种环境,DeepMind 与八家游戏工作室合作,在九款不同的电子游戏上训练并测试了 SIMA。这些游戏包括 Hello Games 的《无人深空》和 Tuxedo Labs 的《Teardown》。每款游戏都为 SIMA 提供了一个新的交互世界,包括从简单的导航和菜单使用到复杂的资源开采、飞船驾驶和头盔制作等一系列技能。


DeepMind 强调,SIMA 是一种 AI 智能体,能够感知并理解各种环境,然后采取行动以实现用户通过自然语言提出的目标。SIMA 包括一个为精确图像 - 语言映射而设计的模型,以及一个视频模型,用于预测屏幕上接下来可能发生的事件。


重要的是,SIMA 不需要访问游戏的源代码或特定 API,它仅需要两项输入:屏幕上的图像用户提供的简单自然语言指令


SIMA 会使用键盘和鼠标输出来控制游戏内的核心角色完成指令执行。由于这套简单的界面组合与人类使用场景相同,因此 SIMA 能够与任何虚拟环境进行交互。当前版本的 SIMA 已经接受了 600 项基本技能评估,涵盖导航(例如「左转」)、对象交互(「爬梯子」)、和菜单使用(「打开地图」)等操作。经过训练,SIMA 约在 10 秒内即可完成简单任务。


通过这项研究,DeepMind 展示了 SIMA 的跨游戏泛化能力,即在多种游戏环境中接受训练的 SIMA 智能体,其性能明显优于只在单一游戏中训练的智能体。研究证明,接受过多种游戏训练的智能体在质量上要远超单一游戏训练出的智能体。在 DeepMind 的评估中,SIMA 智能体在一组九款 3D 游戏上接受了训练,其表现明显优于仅在各单独游戏上进行训练的所有其他专用智能体。


更重要的是,平均来看在八款游戏上进行训练的智能体,在余下一款游戏中的表现同仅在该游戏上训练的智能体几乎水平相当。而这种在全新环境下发挥作用的能力,也凸显出 SIMA 超越其训练环境的强大泛化能力。


目前的初步结果令他们感到欣喜,但 SIMA 还需要更多研究才能在已接触过还尚未接触过的游戏中达到人类玩家的水平。


DeepMind 也谈到,SIMA 的表现依赖于语言指导。在控制测试中,智能体在不接受任何语言训练或指令引导时,就会出现漫无目的、原地打转的情况。同时他们也评估了 SIMA 依照指令完成近 1500 个游戏内不同任务的能力,其中部分任务有人类玩家的协助。


DeepMind 表示,SIMA 的成功展示了通过电子游戏作为测试平台,AI 技术如何帮助人类解决实际问题的巨大潜力。他们希望通过进一步的研究,使 SIMA 能够理解更复杂的指令并执行更多高级任务,最终实现更具通用性和实用性的 AI 系统。


总的来说来说,SIMA 就像是一个能够听懂人类指令并在多个视频游戏世界中执行这些指令的超级游戏玩家。这项研究展示了 AI 技术在理解和执行复杂任务方面的巨大潜力。


SIMA 的能力展示:重塑游戏 AI 的未来


从他们的介绍中,可以窥探,未来的 SIMA 一定会拥有以下“超能力了”。


首先它提高游戏 AI 的质量:通过使用类似 SIMA 的 AI 代理,游戏开发者可以创建出更加智能和适应性强的游戏 AI,这些 AI 能够更自然地与玩家互动,提供更具挑战性和多样性的游戏体验。这种 AI 能够根据自然语言指令执行复杂任务,可能会让游戏世界的 NPC(非玩家角色)行为更加真实和有趣。


其次,它能够加速游戏测试和开发:SIMA 展示了在多种游戏环境中遵循自然语言指令的能力,这意味着它可以被用作自动化测试工具,帮助开发者快速识别游戏中的问题或不足。自动化测试可以提高开发效率,减少重复性工作,使开发团队能够专注于创造性任务。


当然,SIMA 一定会促进游戏设计的创新:SIMA 的研究强调了 AI 和自然语言处理技术在游戏设计中的潜力。开发者可能会受到启发,探索新的游戏机制和故事叙述方法,其中玩家可以通过自然语言与游戏世界互动。这可能会开启全新的游戏类型,其中玩家与游戏世界的交互更加直观和富有沉浸感。


跨游戏学习和适应能力:SIMA 在多个游戏中的表现突出了 AI 的跨游戏学习能力,这对于开发多样化游戏内容的开发者来说是一个重要的里程碑。这种能力意味着 AI 可以在一个游戏中学到的技能和知识转移到另一个游戏中,为开发跨游戏平台或系列游戏提供了新的可能性。


社区反响:玩家和开发者对 SIMA Or Game 的看法


在 Hacker news 的评论区,大家就这个新闻表达了相当高的关注,许多人的焦点是在人工智能的能力、它们与人类玩家的比较,以及 AI 技术的进步是否被过度夸大等。



“我永远不会忘记在 Dota 2017 年的比赛上,OpenAI 展示了一个能够挑战职业 Dota 玩家的 AI。Dota 是一个极其复杂和困难的游戏。这对我来说是一个令人大开眼界的时刻”。- 译


有人分享了 OpenAI 在 Dota 游戏中对抗职业玩家并取得胜利的例子,这被视为 AI 技术的一个重要进展。然而,也有批评声音指出,这些成就并不意味着 AI 已经能够完全理解或在未见过的游戏中表现得像人类那样。


例如,在 Dota 的例子中,为了让 AI 能够参与比赛,游戏的范围被大幅缩减,AI 只需要理解 10 个英雄在两种特定的 5 人组合中的表现,而通常情况下,游戏中有 100 多个英雄可以以任何排列组合选择,某些游戏机制也被限制只对人类玩家使用,因为 AI 无法理解它们。这表明,尽管 AI 在某些受限环境中的表现令人印象深刻,但它们在泛化能力和处理完整游戏版本方面仍然存在巨大差距。



同时也有人持沮丧的观点,认为这对于大型多人在线角色扮演游戏(MMORPG)来说,无疑是一声丧钟。因为以后在这些游戏中都是机器人 AI。。



“我希望开发者能利用这项技术为 NPC 注入更多生命力。很多时候,我们被告知角色扮演游戏中的 NPC 将拥有自己的生活,独立于玩家做自己的事情等等,但这些承诺从未真正实现过任何值得注意的成果。然而,有了 AI 技术,我觉得我们可能正在接近这个目标。”-译


有的网友则表示非支持,SIMA 的出现或许可以给 NPC 赋予更多生命力的期待。然而,一些评论者对于这种技术进步是否真的能使游戏变得更有趣表示怀疑,担心过度追求 NPC 的真实性可能会导致不好的效应,或者增加游戏的摩擦,从而降低游戏体验的乐趣。尽管存在这样的担忧,也有人对未来持乐观态度,认为开发者将找到使用 AI 创造有趣游戏的方法。


从其他的讨论中还看到了,有些人觉得游戏并不需要过分追求现实主义才能变得更好,游戏是现实生活的一种简化或夸张,旨在提供良好的体验而非模仿现实。尽管存在挑战,但许多人相信,随着 AI 技术的进步,游戏开发者将能够创造出新类型的游戏,其中 NPC 的不可预测性和更复杂的行为将成为核心机制,从而为玩家提供全新的游戏体验。



还有些肯定者的评价,这位网友指出 SIMA 代理在接受了九款 3D 游戏集合的训练后,其表现显著超过了仅在单个游戏上训练的专门代理。更令人惊讶的是,即便是在未曾见过的游戏中,经过 N-1 游戏训练的代理也能达到与专门训练代理相近的水平。这一发现挑战了许多人的预期,即 AI 的成功往往被认为是因为训练集中包含了特定的数据,而忽视了算法本身的转移学习能力。


对于 SIMA 或者游戏未来,你有什么想说的?欢迎评论区留下你的建议。


参考链接:


https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/


https://news.ycombinator.com/item?id=39692387

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-03-20 18:595171

评论

发布
暂无评论

需求子任务的数据管理提效实践

转转技术团队

开发工具 测试赋能

人非圣贤孰能无过,Go lang1.18入门精炼教程,由白丁入鸿儒,Go lang错误处理机制EP11

刘悦的技术博客

Go Go web go语言 Go 语言

华能 + Alluxio | 数字化浪潮下跨地域数据联邦访问与分析

Alluxio

数字化 国产化 东数西算 大数据 开源 数据编排

明源云参加2022数字化转型发展高峰论坛并获多项殊荣

科技热闻

开源一夏 | 为什么应该参与开源项目

baiyutang

开源 架构 微服务 开源文化 CloudWeGo

开源一夏 | 使用 HTML、CSS 和 JavaScript 的简单模拟时钟

海拥(haiyong.site)

开源 8月月更

Redis API——List功能实践与性能测试【Go版】

FunTester

字节跳动基于ClickHouse优化实践之Upsert

字节跳动数据平台

OLAP Clickhouse 数据库优化 数据库开发 数据库·

应用实例分析——图像检索

Geek_e369a5

图像搜索

深入浅出分布式事务的实现原理

清风

面试 分布式事务 后端 原理 事务

华为云SparkRTC面向低时延、大通量传输业务的技术探索

华为云开发者联盟

云计算 后端 华为云

49张图带领小伙伴们体验一把 Flowable-UI

江南一点雨

spring springboot workflow flowable

博云入选国家级专精特新「小巨人」名单!

BoCloud博云

云计算 容器 “小巨人”企业

构建元宇宙概念NFT商城系统——艺术数字藏品平台源码部署

开源直播系统源码

软件开发 数字藏品软件开发 数字藏品源码出售

《游戏机图鉴》:发展、继承、崩溃、复兴,游戏机的前世今生

图灵教育

影响全彩LED显示屏质量的几个因素

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家

兆骑科创赛事承办平台,高层次人才引进,创业服务平台

兆骑科创凤阁

水滴低代码搭建——6倍提效,新品首发素材审核系统实践之路

京东科技开发者

CMS 低代码 表单 素材 低代码开发

开源图编辑库 NebulaGraph VEditor 的设计思路分享

NebulaGraph

数据库 图数据库 知识图谱 NebulaGraph

兆骑科创创新创业服务平台,双创活动承办,企业落地孵化

兆骑科创凤阁

如何成就更高远控帧率和流畅度?向日葵SADDC算法浅析

贝锐

算法 视频解码 视觉策略 远程控制

首届腾讯云大数据峰会开幕在即,现场将发布全新一代产品矩阵

科技热闻

数据说|数字经济,山东16市谁最“炫”?排行榜来了

易观分析

数字经济 山东

QCN9074, 802.11ax,Wallys, 4x4 MU-MIMO, 6GHz, wifi6E,

wallys-wifi6

QCN9074

从这 5 个 DevOps “恐怖故事”,我们能学到什么?

SoFlu软件机器人

深度学习公式推导(1):神经元的数学公式

老崔说架构

【Metaverse系列二】3D引擎知多少

ThingJS数字孪生引擎

元宇宙

阿里IM技术分享(八):深度解密钉钉即时消息服务DTIM的技术设计

JackJiang

架构设计 即时通讯 im开发

阿里SpringBoot实战手册横空出世!从此不再是易学难精

冉然学Java

Java 编程 程序员 Spring Boot 构架

Github又爆神作!野生程序员自学SpringCloudAlibaba必备学习笔记开源(阿里2022最新版)

Java永远的神

Java 程序员 面试 微服务 SpringCloud

得物黑科技|AR测量脚型,解决尺码烦恼

得物技术

AR

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗_AI&大模型_李忠良_InfoQ精选文章