【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

溯因推理:人工智能的盲点

  • 2021-11-16
  • 本文字数:4227 字

    阅读完需:约 14 分钟

溯因推理:人工智能的盲点

本文给当今人工智能界推崇深度学习的现象泼了冷水,指出了人工智能的盲点:溯因推理,并提醒人们不要忽视深度学习的种种问题,否则将会因为深度学习又面临第三次“人工智能的冬天”。


最近深度学习领域的进步再次激发了人们对那些通用人工智能新机器的兴趣。这一想法认为,通过构建更大、更好的神经网络,我们就能够获得越来越接近于人类大脑的数字化版本。


但这是一个神话,计算机科学家 Erik Larson 认为,所有的证据都表明,人类和机器所拥有的智能有本质的不同。Larson 的新书《The Myth of Artificial Intelligence: Why Computers Can’t Think the Way We Do》(目前尚无中译本,本文暂译为《人工智能的神话:为什么计算机不能像我们这样思考》),讨论了广泛宣传的关于智能和推理的误解,是如何将人工智能研究引向狭窄的道路,限制了创新和科学发现。


《人工智能的神话》, Erik J. Larson 著。


Larson 警告说,除非科学家、研究人员和支持他们工作的组织不改变方向,否则他们将注定“屈服于机器世界的扩张,在机器世界中,真正的发明被边缘化,转而支持那些鼓吹现有方法的未来主义言论,而这正是来自根深蒂固的利益集团。”

人工智能的神话


以科学的观点来看,人工智能的神话是假定我们将通过在应用领域取得进展,来实现通用人工智能(Artificial General Intelligence,AGI),例如对图像进行分类、理解语音指令,或玩游戏。但是,这些狭窄的人工智能系统的基础技术并不能解决通用智能能力所必须解决的更大挑战,例如进行基本的对话、完成简单的家务活,或者其他需要常识性的任务。


Larson 写道:“当我们成功地应用了更简单、更狭窄的智能版本,并从更快的计算机和大量的数据中获益时,我们并没有逐步取得进展,而是在摘取低垂的果实。”


人工智能神话的文化后果就是忽视了智能的科学奥秘,无休止地谈论深度学习和其他当代技术的不断进步。这个神话阻碍了科学家们思考新的方法来应对智能的挑战。


“如果我们选择忽视一个核心奥秘,而不是正视它,我们就无法获得创新,”Larson 写道,“健康的创新文化强调探索未知,而非夸大现有方法的延伸……关于人工智能必然成功的神话,往往会扼杀真正进步所需要的发明文化。”

演绎、归纳和溯因推理


当你走出家门时,你发现街道是湿的。你首先想到的是,一定是下雨了。但现在是晴天,人行道是干的,所以你立即排除了下雨的可能性。当你往旁边看时,你看到一辆洒水车停在街道旁。你就断定,街道之所以是湿的,是因为洒水车冲洗了街道。


上面是一个“推理”的例子,即从观察到结论的行为,也是智慧生物的基本能力。我们不断地根据我们所知和感知的事物来推理。它们大多发生在潜意识中。


Larson 写道:“任何能够进行推理的系统都必须具有一些基本的智能,因为利用已知和观察到的事物来更新信念的行为本身,必然与我们所指的智慧相关联。”


人工智能研究人员将他们的系统建立在两种类型的推理机上:演绎式和归纳式。演绎式推理是利用先验知识对世界进行推理。这是符号人工智能的基础,也是人工智能早期几十年研究人员关注的重点。工程师通过赋予它们一组预先定义的规则和事实来创建符号系统,人工智能利用这些知识来推理它所接收到的数据。


溯因推理是通过经验获取知识,在过去十年中,溯因推理在人工智能研究人员和科技公司中获得了更多的关注。机器学习算法是溯因推理引擎,一个在相关实例上训练的机器学习模型,将找到输入映射到输出的模式。最近几年,人工智能研究人员利用机器学习、大数据和先进的处理器,对超出符号系统能力的任务进行模型训练。


第三种推理类型,即溯因推理,是由美国科学家 Charles Sanders Peirce 在 19 世纪首次提出的。溯因推理是一种能够提出直觉和假设的认知能力,作出比随机猜测真相更好的猜测。


美国科学家 Charles Sanders Peirce 在 19 世纪提出了溯因推理。资料来源:纽约公共图书馆,公共领域。


举例来说,街道潮湿的原因可能有很多(包括一些我们从未直接经历过的),但是通过溯因推理,我们可以选择最有希望的假设,迅速排除错误的假设,寻找新的假设,并得出可靠的结论。正如 Larson 在《人工智能的神话》一书中写道:“我们从实际上无限可能中猜测哪些假设看起来是可能的或可信的。”


溯因推理就是许多人所说的“常识”。这是我们看待事实或数据的概念框架,也是结合其他推理类型的“粘合剂”。这能让我们时刻注意大脑中大量的信息,以及我们从感官接受到的海量数据中的相关内容。

但问题在于,人工智能界对溯因推理的关注还很少。

人工智能与溯因推理


20 世纪 80 年代和 90 年代,由于溯因逻辑程序(Abductive Logic Programming)的尝试,溯因进入了人工智能的讨论中,但是这些努力都存在缺陷,最终被放弃。Larson 告诉 TechTalks:“它们是对逻辑编程的重新表述,是演绎的一种变体。”


Erik J. Larson,《人工智能的神话》一书作者。


溯因在 2010 年代得到了另一个机会,那就是贝叶斯网络,它是试图计算因果关系的推理引擎。但是,与早期的方法一样,较新的方法也有一个缺陷,它不能捕捉到真正的溯因,Larson 说,贝叶斯和其他图形模型都是“归纳法的变种”。他在《人工智能的神话》一书中称它们为“名副其实的溯因”。

在很大程度上,人工智能的历史都以演绎和归纳为主导。


“当早期人工智能先驱 Alan Newell、Herbert Simon、John McCarthy 和 Marvin Minsky 开始着手解决人工推理(人工智能的核心)问题时,他们认为编写演绎式规则就足以产生智能思维和行动,”Larson 说,“事实上事实并非如此,在关于我们如何做科学的讨论中,这一点应该更早被认识到。”“这太奇怪了,没有人真的停下来,明确地说‘等等,这是行不通的!’” Larson 说,“这将使研究直接转向溯因或假设的生成,或者说,‘上下文敏感推理’。”


在过去的二十年里,随着数据和计算资源的日益丰富,机器学习算法——特别是深度神经网络——已经成为人工智能领域的研究热点。深度学习技术开启了以前超出计算机极限的应用。这也吸引了世界上一些最富有的公司的兴趣和资金。


Larson 说:“我认为,随着万维网的出现,经验式或归纳式(以数据为中心)的方法占据了上风,而溯因法和演绎法一样,基本上被遗忘了。”


但是,机器学习系统也存在严重的局限性,包括缺乏因果关系,边缘情况处理不好和对数据的需求过多。同时,随着研究人员尝试将机器学习应用到医疗和金融等敏感领域,这些限制正变得越来越明显,问题也越来越多。

溯因推理与人工智能的未来之路


包括强化学习先驱 Richard Sutton 在内的一些科学家认为,我们应该坚持使用能够随着数据和计算的可用性而扩展的方法,即学习和搜索。举例来说,随着神经网络的规模越来越大,数据也越来越丰富,它们最终会超越极限,带来新的突破。


Larson 驳斥了数据驱动的人工智能的大规模应用,认为“作为一种智能模型,其本质是有缺陷的”。他重申,尽管搜索和学习都可以提供有用的应用,但是它们是基于非溯因推理。


“如果没有推理思维的革命,搜索就无法扩展到常识或溯因推理中,而这还没有发生。与机器学习类似,学习方法的数据驱动特性意味着推理必须来自数据,可以说,人们经常进行的许多智能推理显然不是这样的,”Larson 说,“我们不会仅仅通过观察过去,比如说,从大型数据集中获取的数据,就能弄清楚对未来的结论、思考或者推理。”


另一些科学家认为,混合人工智能将符号系统与神经网络结合起来,将有望克服深度学习的缺陷。IBM Watson 就是一个例子,它在 《危险边缘》(Jeopardy!)美国电视智力问答节目中击败了世界冠军而闻名。最新的概念证明了混合模型在单独的符号人工智能和深度学习表现不佳的应用中有很好的效果


Larson 认为,混合系统可以填补仅靠机器学习或仅靠规则方法的空白。身为自然语言处理领域的研究人员,他目前正致力于将大型与训练语言模型,如 GPT-3,与知识图谱形式的语义网方面的旧工作相结合,以便在搜索、问题回答和其他任务中创造更好的应用。


“但是演绎-归纳组合并不能让我们达到溯因,因为这三种类型的推理在形式上是不同的,所以它们不能相互还原,也不能结合起来得到第三种。”他说。


Larson 在《人工智能的神话》一书中将规避溯因的努力称为“推理陷阱”。


他写道:“不管计算机的速度有多快,单纯的归纳启发技术,比如机器学习,还是不够的。像 Watson 这样的混合系统,也达不到一般的理解,”“在一个开放的场景,如语言理解,这需要关于世界的知识,而溯因是核心和不可替代的。正因为如此,将演绎与归纳策略相结合的尝试总是注定要失败……这一领域需要一个关于溯因的基础理论。与此同时,我们却被困在了陷阱里。”

人工智能的商业化


人工智能社区对数据驱动方法的狭隘关注,使得研究和创新集中于那些拥有海量数据存储和雄厚财力的少数组织。当深度学习成为一种将数据转换成有利可图的产品的有效方式,大型科技公司正陷入雇佣人工智能人才的激烈竞争,他们通过给研究人员提供丰厚的薪酬,使得他们离开学术界。


这一转变使得非营利性实验室和小公司难以参与到人工智能的研究。


Larson 说:“当你将人工智能研发与大型数据集的所有权和控制权联系在一起时,初创企业就会面临进入壁垒,因为他们并不拥有数据。”他补充说,数据驱动的人工智能从本质上讲就是在商业领域创造了“赢家通吃”的局面。


反过来,人工智能的垄断也阻碍了科学研究。由于大型科技公司集中精力创造可以利用其巨大的数据资源以保持竞争优势的应用,没有什么动力去探索其他人工智能方法。这一领域的工作开始倾向于狭隘而有利可图的应用,而忽视了可以带来新发明的努力。


“目前没有人知道如果没有如此庞大的集中式数据集的情况下,人工智能将会是什么样,因此,对于那些想要通过设计出不同、更强大的人工智能来竞争的企业家来说,没有什么真正的机会。”Larson 说。


Larson 在他的书中警告了当前的人工智能文化,“它在不断编织人工智能神话的同时,从低垂的果实中榨取利润。”他写道,通用人工智能进展的假象可能会导致另一个人工智能的冬天


不过,尽管人工智能的冬天可能会抑制人们对深度学习和数据驱动的人工智能的兴趣,但它也能为新一代的思想家探索新的途径开辟道路。Larson 希望科学家们开始超越现有的方法。


Larson 在《人工智能的神话》一书中提供了一种推理框架,它揭示了当今该领域所面临的挑战,并帮助读者看穿通用人工智能或奇点进展的夸大说法。“我的希望是,非专业人士有一些工具与这种非科学的必然想法作斗争,我的同事和其他人工智能科学家将此视为解决这一领域所面临的现实问题的警钟。”


作者介绍:


Ben Dickson,软件工程师,也是 TechTalks 的创始人,作家,撰写关于科技、商业和政治方面的文章。


原文链接:


https://bdtechtalks.com/2021/09/20/myth-of-artificial-intelligence-erik-larson/

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-11-16 17:472371

评论

发布
暂无评论
发现更多内容

卓越级!浪潮云通过可信云云管理服务能力评估

浪潮云

OpenYurt 如何 “0 侵入” 攻破云边融合难点

阿里巴巴云原生

云计算 Serverless 容器 云原生 边缘计算

源码解析--skywalking agent插件加载流程

cloudcoder

Skywalking 源码剖析 插件设计

真实!对比(阿里/京东等一线大厂)Java面试真题,自己把自己菜哭了

Java架构之路

Java 程序员 架构 面试 编程语言

容器 & 服务:Docker 应用的 Jenkins 构建(二)

程序员架构进阶

容器 服务化 七日更 28天写作 2月春节不断更

瓦力量化交易机器人软件开发|瓦力量化交易机器人APP系统开发

系统开发

利用xml实现数据传输

天狼

翻译:《实用的Python编程》02_06_List_comprehension

codists

Python

大牛荐书 | 百度技术大牛都在读的7本书!

百度Geek说

技术 技术人 书籍推荐 技术书籍

应云而生,幽灵的威胁 - 云原生应用交付与运维的思考

阿里巴巴云原生

云计算 容器 微服务 云原生 k8s

运维工程师小张的日记

XSKY星辰天合

Docker 镜像加速教程

米开朗基杨

Docker 云原生

币管家软件开发|币管家系统APP开发

系统开发

insert、update、delete注入总结

Cc.

网络安全

滴滴Kafka服务体系建设,实战干货都在这里!

滴滴云

大数据 Obsuite 滴滴Kafka

数字货币量化交易APP开发|数字货币量化交易系统软件开发

系统开发

“他者”德意志(一):“进窄门”的德国AI

脑极体

图解定时任务线程池

叫练

面试 定时任务 线程池 Timer 线程池工作原理

分享我的2021京东4面面经,送给备战金三银四的你

Java架构之路

Java 程序员 架构 面试 编程语言

CIO/CTO必读 | 数字转型时代,企业存储支出知多少

焱融科技

存储 焱融科技 CIO 存储成本 IT成本

python精度控制

里昂

Python 数据结构

为语音社交平台加一个防护罩,即构上线实时语音安全方案

ZEGO即构

双指针高频面试题:三数之和的「升级篇」...

宫水三叶的刷题日记

面试 LeetCode 数据结构与算法

华为发布智能云网“五个一”新能力,助力运营商完成云与网的价值归一

脑极体

基于WASM的无侵入式全链路A/B Test实践

韩陆

Flutter-从入门到项目 07: 微信项目-发现页面

iOSer

flutter ios 小程序flutter, 跨平台

「超全!」谷歌大神LeetCode刷题笔记PDF分享

C语言与CPP编程

c++ 程序员 算法 LeetCode 编程、

逆向思维:从小厂到面试大厂,这份学习笔记助我快速成长,实现高薪岗位

Java架构之路

Java 程序员 架构 面试 编程语言

网格量化交易机器人系统开发|网格量化交易机器人软件APP开发

系统开发

Serverless 2.0,鸡蛋还是银弹?

Serverless Devs

腾讯云 阿里云 Serverless 运维 大前端

架构设计篇之微服务实战笔记(六)

小诚信驿站

架构师 刘晓成 小诚信驿站 28天写作 架构师成长笔记

溯因推理:人工智能的盲点_文化 & 方法_Ben Dickson_InfoQ精选文章