AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

AI 教父 Yann LeCun 怒批:今天的大模型比猫还笨,光会预测文本根本没在推理!

  • 2024-10-14
    北京
  • 本文字数:2349 字

    阅读完需:约 8 分钟

大小:1.07M时长:06:13
AI教父Yann LeCun怒批:今天的大模型比猫还笨,光会预测文本根本没在推理!

整理 | 华卫

 

当一大批杰出的技术专家告诉我们,我们即将拥有超越人类智能的计算机,甚至可能取代人类智能时,纽约大学教授、Meta 公司高级研究员、著名的 A.M.Turning 奖获得者 Yann LeCun 却积极争取成为人工智能热潮中最有资格的怀疑论者。

 

LeCun 认为,人工智能实际上并没有达到智能化的边缘。大型语言模型仅仅证明了 “可以操纵语言,却不聪明”,它们永远不会带来真正的通用人工智能(AGI)。但他并不是一个完全的 AGI 怀疑论者,他提到需要新的方法,如 Meta 的基础人工智能研究团队围绕消化真实世界视频所做的工作。

 

在与《华尔街日报》的最新对话中,LeCun 阐述了这样的观点,并在回答关于人工智能变得足够聪明以至于对人类构成威胁的问题时打趣道:“你得原谅我的法语,但这完全是胡说八道。”

 

“现在的人工智能还不如猫”

LeCun 的工作经历以及他在最大的科技公司之一的最有成就的人工智能研究实验室中的地位,让 LeCun 的批评更有分量。

 

2019 年,LeCun 与 Hinton 和 Yoshua Bengio 一起获得了计算机科学领域的最高奖项 A.M. 图灵奖。该奖项表彰了他们在神经网络方面所做的奠基性工作,神经网络是当今许多最强大的人工智能系统(从 OpenAI 的聊天机器人到自动驾驶汽车)的基础。如今,LeCun 继续与他的博士生一起在纽约大学发表论文,并作为 Meta 的首席 AI 科学家,负责监督世界上资金最雄厚的 AI 研究组织之一。

 


今年春天,他在社交平台上与马斯克就科学研究的性质发生了激烈的争论,此前这位亿万富翁发帖宣传他自己的人工智能公司。

 

LeCun 还公开反对 Hinton 和 Bengio 一再警告人工智能对人类构成威胁。Bengio 说,他在许多话题上都同意 LeCun 的观点,但他们在是否可以信任公司确保未来的超级 AI 不会被人类恶意使用或产生恶意意图方面存在分歧。“我希望他是对的,但我认为我们不应该仅仅让公司之间的竞争和利润动机来保护公众和民主,”Bengio 说。“这就是为什么我认为我们需要政府的参与。”

 

LeCun 认为 AI 是一个强大的工具,并列举了许多例子来说明人工智能如何在 Meta 变得极其重要,并推动其规模和收入达到现在约 1.5 万亿美元的估值。“对 Meta 的影响真的很大,”他说。与此同时,他坚信今天的 AI 在任何意义上都不是智能的,而且该领域的许多人,尤其是 AI 初创公司,已经准备好以他认为荒谬的方式推断其最新的发展。

 

如果 LeCun 的观点是正确的,那么对于当今最炙手可热的一些初创公司来说,这就意味着麻烦,更不用说那些在 AI 领域投入数百亿美元的科技巨头了。他们中的许多人都寄希望于这样一种想法,即如今基于大型语言模型的 AI(如 OpenAI 的 ChatGPT)有望在短期内创造出所谓的 AGI,其在很大程度上远超人类的智能水平。

 

OpenAI 的 Sam Altman 上个月表示,我们可以在“几千天内”获得 AGI。马斯克曾表示,这可能会在 2026 年之前发生。LeCun 认为,这样的讨论可能还为时过早。“在我看来,在'紧急弄清楚如何控制比我们聪明得多的 AI 系统'之前,我们需要先有一个比猫更聪明的系统设计线索,”他在社交平台上表示。

 

在 LeCun 看来,猫科动物有物理世界的心智模型、持久记忆以及一定的推理能力和规划能力。而当今的 “前沿 ”人工智能,包括 Meta 公司制造的人工智能,都不具备这些特质。

 

自 1986 年以来就认识 LeCun 的 Léon Bottou 表示,LeCun “固执己见”,也就是说,他愿意听取他人的意见,但一心一意地追求他认为是构建人工智能的正确方法。Alexander Rives 曾是 LeCun 的博士生,后来创办了一家人工智能初创公司。Rives 说:"他历来都能看到该领域在思考问题时存在的差距,并指出这一点。”

 

“今天的模型只是预测不会推理”

LeCun 认为真正的 AGI 是一个值得追求的目标,Meta 也在为之努力。“在未来,当人们与他们的 AI 系统、智能眼镜或其他任何东西交谈时,我们需要这些 AI 系统基本上具备人类水平的特征,真正拥有常识,表现得像人类助手一样。”

 

他表示,要创造出如此强大的人工智能,很可能需要几十年的时间,而今天的主流方法并不能实现这一目标。

 

大型语言模型和类似系统为生成式人工智能的蓬勃发展提供了动力,它们通过海量数据的训练来模仿人类的表达方式。随着每一代模型都变得更加强大,一些专家得出结论认为,只需投入更多芯片和数据来开发未来的人工智能,就能让它们变得越来越强大,最终达到或超过人类智能。这也是将大量投资建设用于训练人工智能的专用芯片池背后的逻辑。

 

LeCun 认为,当今 AI 系统的问题在于它们的设计方式,而不是它们的规模。无论科技巨头们在世界各地的数据中心塞进多少 GPU,今天的 AI 都不会给我们带来 AGI。他敢打赌,对以根本不同方式工作的 AI 进行研究将使我们走上通往人类水平智能的道路。这些假想的未来 AI 系统可以有多种形式,FAIR 正在进行的消化现实世界视频的工作是目前让 LeCun 感到兴奋的项目之一。这个想法是通过从它吸收的视觉信息构建一个世界模型,创建以类似于婴儿动物的方式学习的模型。

 

“ChatGPT 和其他机器人所使用的大型语言模型,也许有一天只能在使用其他技术和算法构建的具有常识和人类能力的系统中发挥微不足道的作用。”LeCun 表示,今天的模型实际上只是在预测文本中的下一个单词。它们在这方面做得如此出色,以至于骗过了我们。由于它们拥有巨大的记忆容量,它们看起来似乎在进行推理,但实际上只是在重复已经接受过训练的信息。

 

“我们已经习惯于认为,能够表达自己或操纵语言的人或实体就是聪明的,但事实并非如此。你可以操纵语言而不聪明,这基本上就是大型语言模型所展示的。”LeCun 说。

 

参考链接:

https://techcrunch.com/2024/10/12/metas-yann-lecun-says-worries-about-a-i-s-existential-threat-are-complete-b-s/

https://www.wsj.com/tech/ai/yann-lecun-ai-meta-aa59e2f5?st=SYmYBM&reflink=desktopwebshare_permalink

2024-10-14 11:214774

评论 1 条评论

发布
用户头像
对AI的批判真的只能限定在彼时,OpenAI的o1模型的CoT,kimi的深入推理,都已经不仅仅是预测了...AGI真的不远了
2024-10-14 14:29 · 中国香港
回复
没有更多了
发现更多内容

华为云ModelArts的使用教程(附详细图解)

逝缘~

华为 华为云 7月月更

被忽视的问题:测试环境配置管理

老张

软件测试 测试环境治理

Nebula Importer 数据导入实践

NebulaGraph

图数据库 数据导入 Nebula Graph

第十八届IET交直流输电国际会议(ACDC2022)于线上成功举办

E科讯

OPPO 小布预训练大模型揭秘:可大规模工业化应用的十亿级模型

OPPO小布助手

AI 智能助手 预训练模型 预训练

【Unity UGUI】ScrollRect 动态缩放格子大小,自动定位到中间的格子

萧然🐳

游戏开发 Unity ScrollView 7月月更 UGUI

智捷云——元宇宙综合解决方案服务商

智捷云

区块链 元宇宙 智捷云 区块链技术开发

什么是低代码开发?

AIRIOT

低代码 物联网 低代码,项目开发

整理混乱的头文件,我用include what you use

华为云开发者联盟

c++ 开发 C语言 技能

PingCode 性能测试之负载测试实践

PingCode研发中心

软件测试 PingCode

五千字讲清楚团队自组织建设 | Liga 妙谈

LigaAI

团队管理 个人提升 敏捷开发管理 LigaAI 自组织协作

同事悄悄告诉我,飞书通知还能这样玩

Jianmu

自动化 建木CI 飞书通知 定时

能源行业的数字化“新”运维

博睿数据

AIOPS 智能运维 博睿数据 能源行业

英特尔集成光电研究最新进展推动共封装光学和光互连技术进步

科技之家

python小知识-python泛函数

AIWeker

Python python小知识 7月月更

DataKit——真正的统一可观测性 Agent

观测云

Python 入门指南之使用 Python 解释器

海拥(haiyong.site)

7月月更

TCP两次挥手,你见过吗?那四次握手呢?

C++后台开发

网络编程 网络协议 TCP/IP 后端开发 C++开发

字节跳动Dev Better技术沙龙成功举办,携手华泰分享Web研发效能提升经验

字节跳动终端技术

字节跳动 前端

DeFi生态NFT流动性挖矿系统开发搭建

薇電13242772558

NFT DeFi流动性挖矿

Numpy 的仿制 2

祖维

c slice Numpy

激进技术派 vs 项目保守派的微服务架构之争

BoCloud博云

微服务 微服务架构 云原生 istio 服务网格

一加10 Pro和iPhone 13怎么选?

Geek_8a195c

图像检索(image retrieval)

Geek_e369a5

图像搜索 图像检索

LeetCode-168. Excel表列名称(java)

bug菌

LeetCode 7月月更

LeaRun.Java快速开发平台 高效代码自动化生成

力软低代码开发平台

NBA赛事直播超清画质背后:阿里云视频云「窄带高清2.0」技术深度解读

阿里云CloudImagine

音视频 直播 视频编码

linux实战清理挖矿病毒kthreaddi

入门小站

Linux

uni-app与uviewUI实现仿小米商城app(附源码)

优秀的李

小程序 uniapp 7月月更 uviewui

输入的查询SQL语句,是如何执行的?

华为云开发者联盟

MySQL sql 开发 语句

你可能不知道,我是如何将一个老系统的kafka消费者服务的性能提升近百倍的

Java全栈架构师

Java kafka 程序员 面试 架构设计

AI教父Yann LeCun怒批:今天的大模型比猫还笨,光会预测文本根本没在推理!_生成式 AI_华卫_InfoQ精选文章