【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

DeepMind 构建了一套模拟想象力的神经网络

  • 2020-02-05
  • 本文字数:2114 字

    阅读完需:约 7 分钟

DeepMind 构建了一套模拟想象力的神经网络

经常有人问我,人工智能有想象力吗?我是怎么回答的呢?现阶段,人工智能可以说是已经具备了一定的想象力,比如基于生成对抗网络(Generative Adversarial Networks,GAN)的各种技术,就能凭空画出实际不存在的、但极为逼真的事物。这可以称为人工智能有想象力吗?我认为可以。今天,DeepMind 为了让人工智能拥有想象力,他们为这一目标做了尝试,让我们看看他们是怎么实现的。想象力并不是关键,关键是自我意识。


为了构建受神经科学启发的架构,DeepMind 创建了一个类似人类思维想象力的模型。


创造出类似人脑认知能力的智能体,一直是人工智能领域中最难以实现的目标之一。最近,我花了一些时间研究几个与深度学习系统中与想象力有关的几个场景,这让我想起了去年 Alphabet 的子公司 DeepMind 发表的一篇关于这一主题的论文,这篇论文的影响力很大。


想象力是人类思维的神奇特征之一,正是有了想象力,我们人类才能够与其他物种区别开来。从神经科学的角度来看,想象力是大脑在没有任何直接的感觉输入的情况下,形成图像或感觉的能力。想象力是我们学习过程中的一个关键因素,因为它使我们能够将知识应用到特定的问题中,并更好地规划未来的结果。当我们在日常生活中执行任务时,为了优化我们的行动,我们会不断地“想象”潜在的结果。这一点儿也不奇怪,因为从认知的角度来看,想象力常常被认为是进行规划的基础。


长期以来,将想象力整合到智能体中,一直是该领域研究人员难以实现的目标。让我们想象一下这样的人工智能程序,它们不仅能够学习新任务,还能规划和推理未来。最近,我们已经看到了一些令人瞩目的研究成果,比如在 AlphaGo 等系统的智能体中添加想象力的方面。去年,他们发表了一篇著名研究论文的最新修订版,该论文概述了实现这一目标的首批神经网络架构之一。


在智能体的背景下,我们该如何定义想象力呢?在 DeepMind 的案例中,他们将想象力增强的智能体定义为包含以下特征的系统:



深度强化学习(Reinforcement learning,RL)通常被认为是想象力增强的智能体的标志,因为它能够试图将观察结果和行为关联起来。但是,深度强化学习系统通常需要大量的训练,训练结果是针对环境中特定任务的知识定制的。DeepMind 的论文提出了一种替代传统模型的方法,即使用通过环境模拟来学习“解释”不完美预测的模型。这一想法是让并行模型使用模拟来提取有用的知识,可用于核心模型。就像我们经常判断一个人(那个家伙没有想象力)一样,我们可以将想象力模型视为深度学习项目的增强能力。

I2A 架构

为了让深度学习智能体能够实现“想象力”,DeepMind 团队依赖于一种 I2A 的智能神经网络架构。I2A 架构的关键元素是一个称为 Imagination Core(想象力核心)的组件,它使用一个环境模型,在给定有关当前环境的信息的情况下,对其未来状态进行预测。给定过去的状态和当前的动作,环境模型可以预测下一个状态和来自环境的任意数量的信号。I2A 架构通过当前的实际观测来初始化想象的轨迹,并随后将模拟的观察结果输入到模型中,在未来的多个时间步骤中 rollout 环境模型。在每次 rollout 中生成的操作有助于定义智能体策略,然后由 Imagination Core 模块使用。


译注:Rollout,在仿真轨迹层面上进行更新学习中,rollout 表示一次试验,一条轨迹。



I2A 架构的关键元素之一是 rollout 编码器,用于负责“解释”Imagination Core 产生的信息,并提取对智能体决策有用的任何信息,甚至在必要时忽略它。

玩仓库番游戏

为了了解 I2A 模型的运行情况,DeepMind 团队创建了一个实现,尝试玩仓库番(Sokoban)游戏。仓库番是一个经典的规划问题,其中智能体必须将许多箱子推到给定的目标位置。因为箱子只能推(而不是拉),所以许多动作是不可逆的,一旦出错,会使游戏无法闯关而失败。因此,人类玩家被迫提前规划走法。想象力增强模型表现出了从不完美的环境(如仓库番)中学习的惊人能力,如以下视频所示:


视频地址:https://v.qq.com/x/page/h3042q70ash.html


译注: 仓库番(Sokoban)是一款经典电子游戏,1982 年由日本 Thinking Rabbit 公司首次发行。之后其他游戏开发者争相制作仿制或衍生作品。致使仓库番成为此类游戏的代名词。游戏要求玩家在二维地图上把箱子推到指定地点,当中牵涉到大量的空间逻辑推理。


DeepMind 团队对照更传统的深度强化技术对 I2A 模型进行了基准测试,结果很是引入注目。I2A 的表现达到了惊人的 85%,远远优于其他策略。



仓库番实验最令人印象深刻的结果之一是,想象力增强的智能体能够在可能不完美的环境模型中想象轨迹,并忽略不准确的信息。考虑到越来越多的场景需要智能体在信息不完善和数据有限的情况下进行操作,这一点尤为重要。


想象力是那些能够为新一代智能体打开大门的关键能力之一。像 I2A 这样的技术,仍然处于非常初级的阶段,但它可以成为增强学习架构的关键组成部分,在这种架构中,智能体不仅能够学习现在,而且还能够“想象”未来。


作者介绍:


Jesus Rodriguez,Invector Labs 首席科学家、执行合伙人。IntoTheBlock 首席技术官。同时具有天使投资人、作家、多家软件公司的董事会成员的身份。


原文链接:


https://towardsdatascience.com/deepmind-builds-neural-networks-that-simulate-imagination-921b31903705


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-02-05 16:011686
用户头像
赵钰莹 InfoQ 主编

发布了 874 篇内容, 共 605.0 次阅读, 收获喜欢 2671 次。

关注

评论

发布
暂无评论
发现更多内容

3DCAT+东风日产:共建线上个性化订车实时云渲染方案

3DCAT实时渲染

汽车虚拟仿真 汽车3D可视化

Python 继承和子类示例:从 Person 到 Student 的演示

小万哥

Python 程序员 软件 后端 开发

你知道ping命令是如何工作的吗?

百度搜索:蓝易云

Linux 运维 ping ICMP Internet

2024深圳国际天然虾青素与天然螺旋藻展览会

吹吹晚风

Kubernetes跨StorageClass迁移,切换Rainbond默认SC

北京好雨科技有限公司

云原生 #Kubernetes# 企业号10月PK榜

自定义过滤器配置 Shiro 认证失败返回 json 数据

emanjusaka

Java shiro

2024杭州国际液压气动装备展览会

吹吹晚风

StarRocks 荣获 InfoWorld 2023 年最佳开源软件

StarRocks

app游戏定制开发【 小游戏定制开发】

V\TG【ch3nguang】

教育培训行业APP软件定制开发

V\TG【ch3nguang】

提升网站性能:Nginx五种高效负载均衡策略

百度搜索:蓝易云

nginx 云计算 Linux 运维 Web

Mac可用的GTD任务管理软件Omnifocus Pro 3

展初云

Mac软件 任务管理软件 GTD

数科公司新动向,借助外部力量寻求增长突破

用友BIP

数科公司

如何选择向量数据库|Weaviate Cloud v.s. Zilliz Cloud

Zilliz

非结构化数据 Zilliz 向量数据库 zillizcloud

Linux ls命令:查看目录下文件

智趣匠

Mac可用的流程图和图形设计软件OmniGraffle Pro 7

展初云

Mac 流程图绘制工具

Mac系统清理和优化软件 CleanMyMac X

展初云

CleanMyMac X Mac软件 系统优化工具

如何平衡表单设计过程中用户体验与企业管控需求(上)

用友BIP

财务共享

产研团队必看!3款在线白板工具助你轻松改善工作!

彭宏豪95

产品经理 科技 产品研发 在线白板 效率软件

区块链DAPP开发技术方案,开启你的区块链时代

V\TG【ch3nguang】

Redis 7.0 源码调试环境搭建与阅读技巧

码哥字节

redis redis 底层原理

🎊OpenTiny Vue 3.11.0 发布:增加富文本、ColorPicker等4个新组件,迎来了贡献者大爆发!

Kagol

关于亚马逊 CodeWhisperer 的测试反馈

亚马逊云科技 (Amazon Web Services)

#人工智能 云上探索实验室 Amazon CodeWhisperer

跨语言高性能 RPC 框架 Focus 架构解析

dinstone

RPC 高性能 跨语言 focus

EMQ 获第八届 “创客中国” 物联网中小企业创新创业大赛一等奖

新消费日报

2024杭州国际密封产品与设备展览会

吹吹晚风

软件开发全文档整理(获取原件)

金陵老街

项目管理 软件文档

SQLSmith: Databend 如何利用随机化测试检测 Bug

Databend

Dapp开发,让你掌握区块链技术-dapp开发团队

V\TG【ch3nguang】

Mac电脑专业批量文件重命名 MetaRename中文激活版

胖墩儿不胖y

Mac软件 重命名工具 重命名软件

为何 DevOps 会给开发人员带来压力和倦怠?

SEAL安全

DevOps 策略 企业号10月PK榜 缺点

DeepMind 构建了一套模拟想象力的神经网络_AI&大模型_Jesus Rodriguez_InfoQ精选文章