把握行业变革关键节点,12 月 19 日 - 20 日,AICon北京站即将重磅启幕! 了解详情
写点什么

Yann LeCun:当人工智能系统不再需要监督学习时,下一场 AI 革命就来了

  • 2022-02-25
  • 本文字数:3079 字

    阅读完需:约 10 分钟

Yann LeCun:当人工智能系统不再需要监督学习时,下一场AI革命就来了

图灵奖得主、Meta AI 首席科学家 Yann LeCun 近日在接受 IEEE Spectrum 采访时表示,自监督学习可以用来构建元宇宙,甚至可能打造人类水平的 AI。</preface>


当 Yann LeCun 发表演讲时,他经常会在幻灯片上展示一幅法国大革命时期的名画。画中的战争场景上写着一行字。“革命是不会被监督的。”


Meta(前 Facebook)副总裁兼首席人工智能科学家 LeCun 认为,当人工智能系统不再需要监督学习时,我们就会迎来下一场人工智能革命。 它们用不着再依赖精心标记的数据集来提供真实来源,不需要靠这些数据集来理解世界并执行指派的任务。


LeCun 说,人工智能系统需要在尽可能减少来自人类的帮助的前提下,学习关于世界的知识。在发送给 IEEE Spectrum 的一份电子邮件答疑中,他谈到了自监督学习如何能创造出富有常识、更强大的 AI 系统。


2 月 23 日,他在一个名为“实验室内部:用 AI 打造元宇宙”的虚拟Meta AI活动中探讨了这一主题。这场活动有来自马克·扎克伯格,Meta 公司的一些人工智能科学家的演讲,以及 LeCun 和 Yoshua Bengio 关于通向人类水平的人工智能之路的讨论。以下是 LeCun 在上述电子邮件中针对 IEEE Spectrum 的几个问题给出的答案。


IEEE Spectrum:你曾说过,监督学习的局限性有时会被误认为是深度学习的天然局限。哪些限制可以通过自监督学习来克服?


Yann LeCun: 监督学习在相对封闭的领域中效果很好,这种情况下你可以收集大量标记好的数据,而且在部署中遇到的输入类型与训练时使用的输入类型没有太大区别。


要收集大量在某些层面上没有偏见的标记数据是很难的。我说的不一定是社会偏见,**而是系统不应该使用的一些数据中的相关性。**一个著名的例子是,当你训练一个系统来识别奶牛,而所有的样本都是在草场上的奶牛,那么系统将用草作为奶牛存在的背景线索。但是,如果你现在展示一头在海滩上散步的奶牛,它就可能很难识别出这头牛了。


自监督学习(SSL)让我们可以训练一个系统,以独立于任务的方式,学习各种输入的良好表征。因为 SSL 训练使用的是未标记的数据,所以我们可以用上非常大的训练集,让系统学习到更强大、更完整的输入表征。


然后系统只需要少量标记数据就可以在任何有监督的任务上获得良好的性能表现。这大大减少了纯监督学习所需要的标记数据量,并让系统更加健壮、更擅长处理与标记的训练样本不一样的输入。它有时还能降低系统对数据中偏见的敏感性 —— 关于这一改进,我们将在未来几周内公开的研究中分享我们的更多见解。


在现实人工智能系统中正在发生的事情是,我们正迈向越来越大的架构,这些架构在大量的无标签数据上用 SSL 进行预训练。这些架构可以用于各种各样的任务。例如,Meta AI 现在有语言翻译系统,可以处理几百种语言,但它仅仅是一个神经网络!我们也有多语言语音识别系统。这些系统可以处理很多我们缺乏相关数据的语言,更不用说有注释的数据了。


IEEE Spectrum:其他领军人物表示,人工智能的发展方向是通过更好的数据标记来改善监督学习。 Andrew Ng 最近和我交流了以数据为中心的人工智能主题,Nvidia 的 Rev Lebaredian 则谈到了自带所有标签的合成数据。那么 AI 领域对于未来发展方向这一主题是否存在分歧?


LeCun:我不认为我们在哲学上有什么分歧。SSL 预训练是 NLP 中非常标准的做法。它在语音识别中显示了出色的性能改进潜力,而且它开始在视觉领域发挥越来越大的作用。然而,“经典”的监督学习仍有许多尚待开发的应用,因此,只要有可能,我们当然应该充分利用合成数据和监督学习。与此同时,Nvidia 也正在积极研究 SSL。


早在 2000 年代中期,Geoff Hinton、Yoshua Bengio 和我就都相信,**我们想要训练非常大和非常深的神经网络,唯一方法是通过自监督(或无监督)学习。**那时 Andrew Ng 开始对深度学习产生了兴趣。他当时的工作也集中在我们现在称之为自监督的方法上。


IEEE Spectrum:自监督学习为什么能通向拥有常识的人工智能系统这一目标? 常识能在多大程度上带我们走向人类水平的人工智能?


LeCun:我认为,一旦我们搞清楚了如何才能让机器像人类和动物一样学习世界的运作方式,人工智能产业就会取得重大进展。


人类和动物主要是通过观察世界和自身在世界中的行动来认识世界和学习知识的。我们理解世界是如何运作的,因为我们已经理解了世界的各种内在模型,使我们能够填补缺失的信息,预测将要发生的事情,并预测我们行动的效果。我们的世界模型让我们能够感知、解释、推理、提前计划和行动。


那么机器该如何学习哪些世界模型呢?


这可以归结为两个问题。我们应该用怎样的学习范式来训练世界模型?世界模型应该使用什么架构? 对于第一个问题,我的答案是 SSL。一个例子是让机器看一段视频,按下停止播放键,然后让机器学习一段表述,告诉机器视频中接下来会发生什么事情。在这样做的过程中,机器可能会学习大量关于世界是如何运作的背景知识,也许这很像是人类和动物的婴儿在生命的最初几周和几个月里的学习方式。


对于第二个问题,我的答案是一种新型的深度宏观架构,我称之为分层联合嵌入预测架构(H-JEPA)。在这里详细解释的话内容就有点太长了,但我们想说的是,JEPA 的目标不是要预测视频片段的未来帧,而是学习视频片段的抽象表示和片段的未来发展信息,这样系统有了对前者的理解基础,就能很容易预测后者。


这一目标可以通过使用非对比性 SSL 方法的一些最新发展成果来实现,我和我的同事最近提出的一种名为 VICReg(方差、不变性、协方差正则化)的方法就会有很大用途。


IEEE Spectrum:几周前,你回应了 OpenAI 的 Ilya Sutskever 的一条推文,他推测今天的大型神经网络可能已经具备了一点意识。你的回答是一个响亮的“不”。在你看来,要想构建一个可以称得上具备意识的神经网络,需要哪些条件?那样的系统会是什么样子的?


LeCun:首先,意识是一个定义非常不明确的概念。一些哲学家、神经科学家和认知科学家认为它只是一种幻觉,我的看法也非常接近这种观点。


但我对导致意识幻觉的原因有一个猜测。我的假设是,我们的前额叶皮层有一个单一的世界模型“引擎”。这个世界模型是可以根据手头的情况进行配置的。我们在一艘帆船上掌舵时,我们的世界模型会模拟空气和水在船上的流动场景。我们制造一张木桌时,我们的世界模型会想象切割木片和把它们组装起来的结果,等等。


在我们的大脑中需要有一个模块,我称之为配置器,它会为我们设定各种目标和子目标,并配置世界模型以模拟手头的情况,还能激励我们的感知系统提取相关信息并抛弃其余信息。如果存在这样一个监督配置器,那可能就是给我们带来意识幻觉的原因所在。


但有趣的是:我们之所以需要这个配置器,是因为我们只有一个单一的世界模型引擎。如果我们的大脑大到足以包含许多世界模型,我们就不需要意识了。因此,从这个意义上说,意识是我们大脑局限性的一个效果。


IEEE Spectrum:自监督学习将在元宇宙的构建过程中发挥什么作用?


LeCun:深度学习在元宇宙有许多具体的应用,其中一些例子包括 VR 和 AR 眼镜的运动追踪、捕捉和重新合成身体运动和面部表情等。


人工智能驱动的新一代创意工具会有很大的市场机遇,它们将让每个人都能在元宇宙中创造新的东西,在现实世界中也一样。但是,元宇宙还有一个“完全是 AI 的应用:虚拟 AI 助手。 我们应该有虚拟的人工智能助手在日常生活中帮助我们,回答我们的任何问题,并帮助我们处理每天涌入的信息洪流。


为此,我们需要这样的人工智能系统拥有对(物理或虚拟)世界如何运作的一些理解、推理和计划的能力,以及某种程度的常识。 简而言之,我们需要弄清楚如何构建能够像人类一样学习的自主 AI 系统。 这将需要很长的时间。但 Meta 在这一领域已经做好了长期作战的准备。


原文链接:https://spectrum.ieee.org/yann-lecun-ai


2022-02-25 13:406815
用户头像
刘燕 InfoQ高级技术编辑

发布了 1123 篇内容, 共 603.3 次阅读, 收获喜欢 1982 次。

关注

评论

发布
暂无评论
发现更多内容

解读西格电力光伏四可装置:可观、可测、可控、可调的技术内涵

西格电力

分布式光伏并网 光伏四可装置 分布式光伏发电 分布式光伏 分布式光伏产品

境外舆情监控服务商对比:哪家的技术支持更到位?

沃观Wovision

舆情监控 海外舆情监测 舆情监控软件 出海舆情

多语种舆情分析专家:国外舆情监控软件的语言文化壁垒突破之道

沃观Wovision

舆情监控 海外舆情监控 舆情监控软件 全球舆情监控

华为试水毛绒 AI 玩具;理想将发布智能眼镜;Quail STT:专为机器优化的语音增强模型丨日报

RTE开发者社区

数据透视分析:流行有道,助力无穷的数据分析神器

郝培强

数据库

N8N+飞书+Coze打造零成本生图神器!

王磊

正版 Altair 软件采购全指南:官方代理商合作流程与安全下载规范

智造软件

仿真 CAE软件 altair CAE仿真

区块链 Web3 项目的开发流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

德克萨斯州 500 万美元购入贝莱德 IBIT:DAT 哑火后,SBR 能接棒重燃吗?

TechubNews

神策分析 Android SDK 网络模块解析!

郝培强

程序员 代码

SpreadJS:数据录入、指标补录与表单填报场景下的高效利器

郝培强

数据管理

用n8n零代码构建你的第一个测试工作流

测吧(北京)科技有限公司

为什么“搞漏洞的”和“搞运营的”总是说不到一块去

塞讯科技

网络安全

AI跨界潮:金融精英与应届生正涌入人工智能领域

郝培强

人工智能

触“见”世界:基于Rokid AI眼镜的视障人士环境感知系统

鸽芷咕

人工智能 AR

Apache Doris 中的 Data Trait:性能提速 2 倍的秘密武器

SelectDB

数据库 apache 社区

Geomys开源维护标准:构建安全可靠的软件供应链

qife122

供应链安全 开源维护

驱动全球增长:8个行业专业的境外舆情监控服务商

沃观Wovision

跨境贸易 舆情监控 海外舆情监测 境外舆情监控 出海舆情

荣耀加冕 领航未来——中国重汽揽获多项权威殊荣,看其如何引领高端新局

科技经济

喜报|凡得科技斩获 2025 年度最佳快消品行业 AI 服务商,流程挖掘拥抱AI、探索更大价值赋能

凡得流程PROCESS X

零售行业 流程挖掘 快消品 蒙牛 华润集团

告别错单漏装!这款家具组装MES 让定制交付又快又准

万界星空科技

mes 万界星空科技mes 制造业转型 家具行业 家具mes

AI 英语学习 App 的开发流程

北京木奇移动技术有限公司

AI教育 软件外包公司 AI英语

7大海外社交媒体监测服务深度横评:数据与功能

沃观Wovision

社媒监测 海外社交媒体监控 社交媒体监测 社媒分析

2025年中国SD-WAN服务商性价比排行

光联世纪

“全球金牌敏捷课程” · 2026年1月17-18日CSM认证课程 ·

ShineScrum

敏捷 Scrum Master CSM CSM认证 CSM认证培训

2024年-2025年开源语音数据汇总:数十万小时多语种、儿童老人语音、医疗健康等(截止2025年11月)

RTE开发者社区

1688工厂数据API开发指南

Datafox(数据狐)

1688API 1688工厂信息接口 1688公司信息接口 1688店铺档案接口

「腾讯云NoSQL」技术之向量数据库篇: 索引六边形战士IVF-RabitQ如何实现集性能、成本、召回于一身

腾讯云数据库

索引 向量数据库 腾讯云数据库 数据库技术 腾讯云NoSQL

选择前必看:评估海外社交媒体监测服务的8个关键问题

沃观Wovision

社交媒体 海外舆情监测 社交媒体监控 海外社交媒体监控 社媒分析

三层交换机通过非管理型二层交换机实现VLAN间路由的技术解析

qife122

网络工程 交换机配置

驱动全球增长:必备的海外社交媒体监测服务

沃观Wovision

海外舆情监测 出海舆情 出海媒体监测 媒体监测 社媒分析

Yann LeCun:当人工智能系统不再需要监督学习时,下一场AI革命就来了_AI&大模型_Eliza Strickland_InfoQ精选文章