NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

Yann LeCun:当人工智能系统不再需要监督学习时,下一场 AI 革命就来了

  • 2022-02-25
  • 本文字数:3079 字

    阅读完需:约 10 分钟

Yann LeCun:当人工智能系统不再需要监督学习时,下一场AI革命就来了

图灵奖得主、Meta AI 首席科学家 Yann LeCun 近日在接受 IEEE Spectrum 采访时表示,自监督学习可以用来构建元宇宙,甚至可能打造人类水平的 AI。</preface>


当 Yann LeCun 发表演讲时,他经常会在幻灯片上展示一幅法国大革命时期的名画。画中的战争场景上写着一行字。“革命是不会被监督的。”


Meta(前 Facebook)副总裁兼首席人工智能科学家 LeCun 认为,当人工智能系统不再需要监督学习时,我们就会迎来下一场人工智能革命。 它们用不着再依赖精心标记的数据集来提供真实来源,不需要靠这些数据集来理解世界并执行指派的任务。


LeCun 说,人工智能系统需要在尽可能减少来自人类的帮助的前提下,学习关于世界的知识。在发送给 IEEE Spectrum 的一份电子邮件答疑中,他谈到了自监督学习如何能创造出富有常识、更强大的 AI 系统。


2 月 23 日,他在一个名为“实验室内部:用 AI 打造元宇宙”的虚拟Meta AI活动中探讨了这一主题。这场活动有来自马克·扎克伯格,Meta 公司的一些人工智能科学家的演讲,以及 LeCun 和 Yoshua Bengio 关于通向人类水平的人工智能之路的讨论。以下是 LeCun 在上述电子邮件中针对 IEEE Spectrum 的几个问题给出的答案。


IEEE Spectrum:你曾说过,监督学习的局限性有时会被误认为是深度学习的天然局限。哪些限制可以通过自监督学习来克服?


Yann LeCun: 监督学习在相对封闭的领域中效果很好,这种情况下你可以收集大量标记好的数据,而且在部署中遇到的输入类型与训练时使用的输入类型没有太大区别。


要收集大量在某些层面上没有偏见的标记数据是很难的。我说的不一定是社会偏见,**而是系统不应该使用的一些数据中的相关性。**一个著名的例子是,当你训练一个系统来识别奶牛,而所有的样本都是在草场上的奶牛,那么系统将用草作为奶牛存在的背景线索。但是,如果你现在展示一头在海滩上散步的奶牛,它就可能很难识别出这头牛了。


自监督学习(SSL)让我们可以训练一个系统,以独立于任务的方式,学习各种输入的良好表征。因为 SSL 训练使用的是未标记的数据,所以我们可以用上非常大的训练集,让系统学习到更强大、更完整的输入表征。


然后系统只需要少量标记数据就可以在任何有监督的任务上获得良好的性能表现。这大大减少了纯监督学习所需要的标记数据量,并让系统更加健壮、更擅长处理与标记的训练样本不一样的输入。它有时还能降低系统对数据中偏见的敏感性 —— 关于这一改进,我们将在未来几周内公开的研究中分享我们的更多见解。


在现实人工智能系统中正在发生的事情是,我们正迈向越来越大的架构,这些架构在大量的无标签数据上用 SSL 进行预训练。这些架构可以用于各种各样的任务。例如,Meta AI 现在有语言翻译系统,可以处理几百种语言,但它仅仅是一个神经网络!我们也有多语言语音识别系统。这些系统可以处理很多我们缺乏相关数据的语言,更不用说有注释的数据了。


IEEE Spectrum:其他领军人物表示,人工智能的发展方向是通过更好的数据标记来改善监督学习。 Andrew Ng 最近和我交流了以数据为中心的人工智能主题,Nvidia 的 Rev Lebaredian 则谈到了自带所有标签的合成数据。那么 AI 领域对于未来发展方向这一主题是否存在分歧?


LeCun:我不认为我们在哲学上有什么分歧。SSL 预训练是 NLP 中非常标准的做法。它在语音识别中显示了出色的性能改进潜力,而且它开始在视觉领域发挥越来越大的作用。然而,“经典”的监督学习仍有许多尚待开发的应用,因此,只要有可能,我们当然应该充分利用合成数据和监督学习。与此同时,Nvidia 也正在积极研究 SSL。


早在 2000 年代中期,Geoff Hinton、Yoshua Bengio 和我就都相信,**我们想要训练非常大和非常深的神经网络,唯一方法是通过自监督(或无监督)学习。**那时 Andrew Ng 开始对深度学习产生了兴趣。他当时的工作也集中在我们现在称之为自监督的方法上。


IEEE Spectrum:自监督学习为什么能通向拥有常识的人工智能系统这一目标? 常识能在多大程度上带我们走向人类水平的人工智能?


LeCun:我认为,一旦我们搞清楚了如何才能让机器像人类和动物一样学习世界的运作方式,人工智能产业就会取得重大进展。


人类和动物主要是通过观察世界和自身在世界中的行动来认识世界和学习知识的。我们理解世界是如何运作的,因为我们已经理解了世界的各种内在模型,使我们能够填补缺失的信息,预测将要发生的事情,并预测我们行动的效果。我们的世界模型让我们能够感知、解释、推理、提前计划和行动。


那么机器该如何学习哪些世界模型呢?


这可以归结为两个问题。我们应该用怎样的学习范式来训练世界模型?世界模型应该使用什么架构? 对于第一个问题,我的答案是 SSL。一个例子是让机器看一段视频,按下停止播放键,然后让机器学习一段表述,告诉机器视频中接下来会发生什么事情。在这样做的过程中,机器可能会学习大量关于世界是如何运作的背景知识,也许这很像是人类和动物的婴儿在生命的最初几周和几个月里的学习方式。


对于第二个问题,我的答案是一种新型的深度宏观架构,我称之为分层联合嵌入预测架构(H-JEPA)。在这里详细解释的话内容就有点太长了,但我们想说的是,JEPA 的目标不是要预测视频片段的未来帧,而是学习视频片段的抽象表示和片段的未来发展信息,这样系统有了对前者的理解基础,就能很容易预测后者。


这一目标可以通过使用非对比性 SSL 方法的一些最新发展成果来实现,我和我的同事最近提出的一种名为 VICReg(方差、不变性、协方差正则化)的方法就会有很大用途。


IEEE Spectrum:几周前,你回应了 OpenAI 的 Ilya Sutskever 的一条推文,他推测今天的大型神经网络可能已经具备了一点意识。你的回答是一个响亮的“不”。在你看来,要想构建一个可以称得上具备意识的神经网络,需要哪些条件?那样的系统会是什么样子的?


LeCun:首先,意识是一个定义非常不明确的概念。一些哲学家、神经科学家和认知科学家认为它只是一种幻觉,我的看法也非常接近这种观点。


但我对导致意识幻觉的原因有一个猜测。我的假设是,我们的前额叶皮层有一个单一的世界模型“引擎”。这个世界模型是可以根据手头的情况进行配置的。我们在一艘帆船上掌舵时,我们的世界模型会模拟空气和水在船上的流动场景。我们制造一张木桌时,我们的世界模型会想象切割木片和把它们组装起来的结果,等等。


在我们的大脑中需要有一个模块,我称之为配置器,它会为我们设定各种目标和子目标,并配置世界模型以模拟手头的情况,还能激励我们的感知系统提取相关信息并抛弃其余信息。如果存在这样一个监督配置器,那可能就是给我们带来意识幻觉的原因所在。


但有趣的是:我们之所以需要这个配置器,是因为我们只有一个单一的世界模型引擎。如果我们的大脑大到足以包含许多世界模型,我们就不需要意识了。因此,从这个意义上说,意识是我们大脑局限性的一个效果。


IEEE Spectrum:自监督学习将在元宇宙的构建过程中发挥什么作用?


LeCun:深度学习在元宇宙有许多具体的应用,其中一些例子包括 VR 和 AR 眼镜的运动追踪、捕捉和重新合成身体运动和面部表情等。


人工智能驱动的新一代创意工具会有很大的市场机遇,它们将让每个人都能在元宇宙中创造新的东西,在现实世界中也一样。但是,元宇宙还有一个“完全是 AI 的应用:虚拟 AI 助手。 我们应该有虚拟的人工智能助手在日常生活中帮助我们,回答我们的任何问题,并帮助我们处理每天涌入的信息洪流。


为此,我们需要这样的人工智能系统拥有对(物理或虚拟)世界如何运作的一些理解、推理和计划的能力,以及某种程度的常识。 简而言之,我们需要弄清楚如何构建能够像人类一样学习的自主 AI 系统。 这将需要很长的时间。但 Meta 在这一领域已经做好了长期作战的准备。


原文链接:https://spectrum.ieee.org/yann-lecun-ai


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-02-25 13:404919
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 494.5 次阅读, 收获喜欢 1968 次。

关注

评论

发布
暂无评论
发现更多内容

Loopback for Mac(音频路由和虚拟音频设备软件) v2.3.2直装激活版

mac

苹果mac Windows软件 Loopback 虚拟音频软件

正确选择数据库安全运维平台的几个原则-行云管家

行云管家

数据库 数据安全 数据库安全 安全运维

社区团购,拯救消费降级的利器

用友BIP

社区团购

中国水泥行业数字化采购:驱动产业链供应链现代化的关键

用友BIP

数智采购

Prompt模板助力应用升级

百度开发者中心

人工智能 大模型训练 Prompt

Illustrator 2023 for mac(ai2023矢量图编辑软件) v27.9密钥激活版

mac

苹果mac Windows软件 矢量图形编辑软件 ​illustrator 2023

腾讯云入选2023 Gartner分布式混合基础设施魔力象限

Geek_2d6073

当AI遇上3D建模:一场创意与技术的完美碰撞!

Finovy Cloud

AI 3D

《永劫无间》新版本上线,英特尔锐炫及XeSS即时支持,助力玩家丝滑畅游!

E科讯

管控变更对提升质量的重要性

老张

质量保障 配置管理

IBM只有29%的职位看学历?基于技能的招聘到底是什么?

用友BIP

智能招聘

最新开源、更擅长推理的中文大模型

百度开发者中心

人工智能 大模型

大模型训练-实战的模型、算力与数据训练

百度开发者中心

人工智能 大模型训练

2个数仓中不等值关联优化案例

华为云开发者联盟

数据库 后端 华为云 数仓 华为云开发者联盟

将 Amazon EC2 到 Amazon S3 的数据传输推向100Gbps 线速

亚马逊云科技 (Amazon Web Services)

S3 Amazon EC2 亚马逊云科技

熟练使用 Redis 的五大数据结构:Java 实战教程

互联网工科生

Java redis

Mac电脑高效音频录制 Piezo 最新 for mac

mac大玩家j

Mac软件 音频录制软件 录音软件

DAPP智能合约双币质押挖矿项目系统开发

l8l259l3365

注释在编程中的重要性:理解程序员的两难选择

小魏写代码

ZGC关键技术分析

得物技术

Java 高性能 GC算法

IDO官网预售 创建 ICO 解决方案:为您的代币发行奠定基础

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 链游开发 NFT开发

千帆大模型平台引领Falcon-180B适配创新

百度开发者中心

人工智能 Prompt 千帆大模型平台

Python并发编程:多线程技术详解

高端章鱼哥

Python 并发编程

云图说|交换数据空间Exchange Data Space

华为云开发者联盟

数据交换 开发 华为云 华为云开发者联盟

不会写代码同学的福音——AI 代码生成器 Amazon CodeWhisperer(通过注释写代码)

亚马逊云科技 (Amazon Web Services)

人工智能 CodeWhisperer Amazon Lambda 云上探索实验室

ABAQUS二次开发怎样接入Python代码?ABAQUS软件教程

思茂信息

abaqus abaqus软件 abaqus有限元仿真

在Vue中使用Mock.js虚拟接口数据实例详解

树上有只程序猿

Vue Mock.js

用大模型Prompt解决行业问题

百度开发者中心

大模型训练 Prompt

文末福利免费送 | KaiwuDB AI 时代数据库技术专题沙龙,名额仅剩 20 位,报名从速!

KaiwuDB

数据库 KaiwuDB

什么是智慧光伏?智慧光伏电站运维平台

2D3D前端可视化开发

物联网 数字孪生 三维可视化 智慧光伏 智慧电站

NFTScan 正式上线 Scroll NFTScan 浏览器和 NFT API 数据服务

NFT Research

NFT NFTScan nft工具

Yann LeCun:当人工智能系统不再需要监督学习时,下一场AI革命就来了_AI&大模型_Eliza Strickland_InfoQ精选文章