写点什么

AI 教父 Yann LeCun 怒批:今天的大模型比猫还笨,光会预测文本根本没在推理!

  • 2024-10-14
    北京
  • 本文字数:2349 字

    阅读完需:约 8 分钟

大小:1.07M时长:06:13
AI教父Yann LeCun怒批:今天的大模型比猫还笨,光会预测文本根本没在推理!

整理 | 华卫

 

当一大批杰出的技术专家告诉我们,我们即将拥有超越人类智能的计算机,甚至可能取代人类智能时,纽约大学教授、Meta 公司高级研究员、著名的 A.M.Turning 奖获得者 Yann LeCun 却积极争取成为人工智能热潮中最有资格的怀疑论者。

 

LeCun 认为,人工智能实际上并没有达到智能化的边缘。大型语言模型仅仅证明了 “可以操纵语言,却不聪明”,它们永远不会带来真正的通用人工智能(AGI)。但他并不是一个完全的 AGI 怀疑论者,他提到需要新的方法,如 Meta 的基础人工智能研究团队围绕消化真实世界视频所做的工作。

 

在与《华尔街日报》的最新对话中,LeCun 阐述了这样的观点,并在回答关于人工智能变得足够聪明以至于对人类构成威胁的问题时打趣道:“你得原谅我的法语,但这完全是胡说八道。”

 

“现在的人工智能还不如猫”

LeCun 的工作经历以及他在最大的科技公司之一的最有成就的人工智能研究实验室中的地位,让 LeCun 的批评更有分量。

 

2019 年,LeCun 与 Hinton 和 Yoshua Bengio 一起获得了计算机科学领域的最高奖项 A.M. 图灵奖。该奖项表彰了他们在神经网络方面所做的奠基性工作,神经网络是当今许多最强大的人工智能系统(从 OpenAI 的聊天机器人到自动驾驶汽车)的基础。如今,LeCun 继续与他的博士生一起在纽约大学发表论文,并作为 Meta 的首席 AI 科学家,负责监督世界上资金最雄厚的 AI 研究组织之一。

 


今年春天,他在社交平台上与马斯克就科学研究的性质发生了激烈的争论,此前这位亿万富翁发帖宣传他自己的人工智能公司。

 

LeCun 还公开反对 Hinton 和 Bengio 一再警告人工智能对人类构成威胁。Bengio 说,他在许多话题上都同意 LeCun 的观点,但他们在是否可以信任公司确保未来的超级 AI 不会被人类恶意使用或产生恶意意图方面存在分歧。“我希望他是对的,但我认为我们不应该仅仅让公司之间的竞争和利润动机来保护公众和民主,”Bengio 说。“这就是为什么我认为我们需要政府的参与。”

 

LeCun 认为 AI 是一个强大的工具,并列举了许多例子来说明人工智能如何在 Meta 变得极其重要,并推动其规模和收入达到现在约 1.5 万亿美元的估值。“对 Meta 的影响真的很大,”他说。与此同时,他坚信今天的 AI 在任何意义上都不是智能的,而且该领域的许多人,尤其是 AI 初创公司,已经准备好以他认为荒谬的方式推断其最新的发展。

 

如果 LeCun 的观点是正确的,那么对于当今最炙手可热的一些初创公司来说,这就意味着麻烦,更不用说那些在 AI 领域投入数百亿美元的科技巨头了。他们中的许多人都寄希望于这样一种想法,即如今基于大型语言模型的 AI(如 OpenAI 的 ChatGPT)有望在短期内创造出所谓的 AGI,其在很大程度上远超人类的智能水平。

 

OpenAI 的 Sam Altman 上个月表示,我们可以在“几千天内”获得 AGI。马斯克曾表示,这可能会在 2026 年之前发生。LeCun 认为,这样的讨论可能还为时过早。“在我看来,在'紧急弄清楚如何控制比我们聪明得多的 AI 系统'之前,我们需要先有一个比猫更聪明的系统设计线索,”他在社交平台上表示。

 

在 LeCun 看来,猫科动物有物理世界的心智模型、持久记忆以及一定的推理能力和规划能力。而当今的 “前沿 ”人工智能,包括 Meta 公司制造的人工智能,都不具备这些特质。

 

自 1986 年以来就认识 LeCun 的 Léon Bottou 表示,LeCun “固执己见”,也就是说,他愿意听取他人的意见,但一心一意地追求他认为是构建人工智能的正确方法。Alexander Rives 曾是 LeCun 的博士生,后来创办了一家人工智能初创公司。Rives 说:"他历来都能看到该领域在思考问题时存在的差距,并指出这一点。”

 

“今天的模型只是预测不会推理”

LeCun 认为真正的 AGI 是一个值得追求的目标,Meta 也在为之努力。“在未来,当人们与他们的 AI 系统、智能眼镜或其他任何东西交谈时,我们需要这些 AI 系统基本上具备人类水平的特征,真正拥有常识,表现得像人类助手一样。”

 

他表示,要创造出如此强大的人工智能,很可能需要几十年的时间,而今天的主流方法并不能实现这一目标。

 

大型语言模型和类似系统为生成式人工智能的蓬勃发展提供了动力,它们通过海量数据的训练来模仿人类的表达方式。随着每一代模型都变得更加强大,一些专家得出结论认为,只需投入更多芯片和数据来开发未来的人工智能,就能让它们变得越来越强大,最终达到或超过人类智能。这也是将大量投资建设用于训练人工智能的专用芯片池背后的逻辑。

 

LeCun 认为,当今 AI 系统的问题在于它们的设计方式,而不是它们的规模。无论科技巨头们在世界各地的数据中心塞进多少 GPU,今天的 AI 都不会给我们带来 AGI。他敢打赌,对以根本不同方式工作的 AI 进行研究将使我们走上通往人类水平智能的道路。这些假想的未来 AI 系统可以有多种形式,FAIR 正在进行的消化现实世界视频的工作是目前让 LeCun 感到兴奋的项目之一。这个想法是通过从它吸收的视觉信息构建一个世界模型,创建以类似于婴儿动物的方式学习的模型。

 

“ChatGPT 和其他机器人所使用的大型语言模型,也许有一天只能在使用其他技术和算法构建的具有常识和人类能力的系统中发挥微不足道的作用。”LeCun 表示,今天的模型实际上只是在预测文本中的下一个单词。它们在这方面做得如此出色,以至于骗过了我们。由于它们拥有巨大的记忆容量,它们看起来似乎在进行推理,但实际上只是在重复已经接受过训练的信息。

 

“我们已经习惯于认为,能够表达自己或操纵语言的人或实体就是聪明的,但事实并非如此。你可以操纵语言而不聪明,这基本上就是大型语言模型所展示的。”LeCun 说。

 

参考链接:

https://techcrunch.com/2024/10/12/metas-yann-lecun-says-worries-about-a-i-s-existential-threat-are-complete-b-s/

https://www.wsj.com/tech/ai/yann-lecun-ai-meta-aa59e2f5?st=SYmYBM&reflink=desktopwebshare_permalink

2024-10-14 11:214856

评论 1 条评论

发布
用户头像
对AI的批判真的只能限定在彼时,OpenAI的o1模型的CoT,kimi的深入推理,都已经不仅仅是预测了...AGI真的不远了
2024-10-14 14:29 · 中国香港
回复
没有更多了
发现更多内容

因为一个字符校对问题,我的大厂面试挂了

华为云开发者联盟

MySQL 字符 字符校对 语句 MySQL5.7

【LeetCode】包含min函数的栈Java题解

Albert

算法 LeetCode 6月日更

mPaaS 月度小报 | 应用上线前都应该检查哪些指标?CodeHub#5回顾:小程序容器加持下的技术架构“提质增效”

蚂蚁集团移动开发平台 mPaaS

小程序 移动开发 mPaaS

全球案例 | 一家财富500强公司利用 Jira 和 Jira Align 将万人级团队的生产力提高了 30%

Atlassian

管理 DevOps 敏捷 Jira 协同办公

个推CTO谈数据中台(上):从要求、方法论到应用实践

个推

大数据 数据中台 数字化转型 数据智能

苏州源控电子科技怎么样?名副其实的行业新星

Geek_8a195c

计算机视觉常用图像数据集标记平台

不脱发的程序猿

人工智能 计算机视觉 图像处理 图像数据集标记平台

BoCloud博云微服务平台3.0正式发布:让微服务转型路径更清晰

BoCloud博云

微服务

工业制造业在数字化时代的三大发展方向

CECBC

Serverless over Storage

焱融科技

云计算 容器 云原生 高性能 文件存储

智慧工厂VR拆解零件——3D虚实现实可视化系统

一只数据鲸鱼

数据可视化 工业互联网 vr 智慧工厂 零件拆解

NUCLEO-L432KC实现GPIO控制(STM32L432KC)

不脱发的程序猿

嵌入式 stm32 单片机 NUCLEO-L432KC STM32L432KC

GitHub上收录400余篇任正非的讲话稿

不脱发的程序猿

GitHub 开源 程序人生 任正非讲话

六一限定,致每一个追光者

白洞计划

从VMWare安装到Nginx配置

wildpig

nginx vmware Centos 7

实现接口幂等性的四种方案!

李阿柯

面试 编程之路 幂等性

数字人民币有望为全球贸易结算开辟新视窗

CECBC

模块五总结

竹林七贤

Android studio 在外置硬盘运行项目报.lock 的错误

三爻

flutter android Mac Android Studio

智慧光伏能源-园区光伏发电能源管控可视化

一只数据鲸鱼

数据可视化 智慧园区 智慧能源 能源管理 光伏发电

☕️【Java技术之旅】深入学习JIT编译器实现机制(原理篇)

码界西柚

Java 编译器 JIT 6月日更

六一儿童节,看我用ModelArts让8090梦回童年

华为云开发者联盟

AI 美食 童年 modelarts 六一

Python3 Note 对象初始化

awen

Python 生命周期 对象初始化

Python3 Note __slots__

awen

Python slots

用敏捷扑克做需求评审的3大优势,你get了吗?

LigaAI

高效工作 团队管理 产品思考

人生算法:涌现,在自己身上发挥群体智慧

石云升

读书笔记 6月日更

净筹6亿美元:微盟正在加速拉开差距

ToB行业头条

SaaS 微盟

一文带你认识队列数据结构

华为云开发者联盟

Java 数据结构 数组 队列

Python3 Note 函数注解

awen

Python Function 函数注解

安迈云首席战略官于晓晖:去中心化云计算构建Web3.0世界

DT极客

“图发展”与“保安全”:大数据今后怎么玩?

CECBC

AI教父Yann LeCun怒批:今天的大模型比猫还笨,光会预测文本根本没在推理!_生成式 AI_华卫_InfoQ精选文章