【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

溯因推理:人工智能的盲点

  • 2021-11-16
  • 本文字数:4227 字

    阅读完需:约 14 分钟

溯因推理:人工智能的盲点

本文给当今人工智能界推崇深度学习的现象泼了冷水,指出了人工智能的盲点:溯因推理,并提醒人们不要忽视深度学习的种种问题,否则将会因为深度学习又面临第三次“人工智能的冬天”。


最近深度学习领域的进步再次激发了人们对那些通用人工智能新机器的兴趣。这一想法认为,通过构建更大、更好的神经网络,我们就能够获得越来越接近于人类大脑的数字化版本。


但这是一个神话,计算机科学家 Erik Larson 认为,所有的证据都表明,人类和机器所拥有的智能有本质的不同。Larson 的新书《The Myth of Artificial Intelligence: Why Computers Can’t Think the Way We Do》(目前尚无中译本,本文暂译为《人工智能的神话:为什么计算机不能像我们这样思考》),讨论了广泛宣传的关于智能和推理的误解,是如何将人工智能研究引向狭窄的道路,限制了创新和科学发现。


《人工智能的神话》, Erik J. Larson 著。


Larson 警告说,除非科学家、研究人员和支持他们工作的组织不改变方向,否则他们将注定“屈服于机器世界的扩张,在机器世界中,真正的发明被边缘化,转而支持那些鼓吹现有方法的未来主义言论,而这正是来自根深蒂固的利益集团。”

人工智能的神话


以科学的观点来看,人工智能的神话是假定我们将通过在应用领域取得进展,来实现通用人工智能(Artificial General Intelligence,AGI),例如对图像进行分类、理解语音指令,或玩游戏。但是,这些狭窄的人工智能系统的基础技术并不能解决通用智能能力所必须解决的更大挑战,例如进行基本的对话、完成简单的家务活,或者其他需要常识性的任务。


Larson 写道:“当我们成功地应用了更简单、更狭窄的智能版本,并从更快的计算机和大量的数据中获益时,我们并没有逐步取得进展,而是在摘取低垂的果实。”


人工智能神话的文化后果就是忽视了智能的科学奥秘,无休止地谈论深度学习和其他当代技术的不断进步。这个神话阻碍了科学家们思考新的方法来应对智能的挑战。


“如果我们选择忽视一个核心奥秘,而不是正视它,我们就无法获得创新,”Larson 写道,“健康的创新文化强调探索未知,而非夸大现有方法的延伸……关于人工智能必然成功的神话,往往会扼杀真正进步所需要的发明文化。”

演绎、归纳和溯因推理


当你走出家门时,你发现街道是湿的。你首先想到的是,一定是下雨了。但现在是晴天,人行道是干的,所以你立即排除了下雨的可能性。当你往旁边看时,你看到一辆洒水车停在街道旁。你就断定,街道之所以是湿的,是因为洒水车冲洗了街道。


上面是一个“推理”的例子,即从观察到结论的行为,也是智慧生物的基本能力。我们不断地根据我们所知和感知的事物来推理。它们大多发生在潜意识中。


Larson 写道:“任何能够进行推理的系统都必须具有一些基本的智能,因为利用已知和观察到的事物来更新信念的行为本身,必然与我们所指的智慧相关联。”


人工智能研究人员将他们的系统建立在两种类型的推理机上:演绎式和归纳式。演绎式推理是利用先验知识对世界进行推理。这是符号人工智能的基础,也是人工智能早期几十年研究人员关注的重点。工程师通过赋予它们一组预先定义的规则和事实来创建符号系统,人工智能利用这些知识来推理它所接收到的数据。


溯因推理是通过经验获取知识,在过去十年中,溯因推理在人工智能研究人员和科技公司中获得了更多的关注。机器学习算法是溯因推理引擎,一个在相关实例上训练的机器学习模型,将找到输入映射到输出的模式。最近几年,人工智能研究人员利用机器学习、大数据和先进的处理器,对超出符号系统能力的任务进行模型训练。


第三种推理类型,即溯因推理,是由美国科学家 Charles Sanders Peirce 在 19 世纪首次提出的。溯因推理是一种能够提出直觉和假设的认知能力,作出比随机猜测真相更好的猜测。


美国科学家 Charles Sanders Peirce 在 19 世纪提出了溯因推理。资料来源:纽约公共图书馆,公共领域。


举例来说,街道潮湿的原因可能有很多(包括一些我们从未直接经历过的),但是通过溯因推理,我们可以选择最有希望的假设,迅速排除错误的假设,寻找新的假设,并得出可靠的结论。正如 Larson 在《人工智能的神话》一书中写道:“我们从实际上无限可能中猜测哪些假设看起来是可能的或可信的。”


溯因推理就是许多人所说的“常识”。这是我们看待事实或数据的概念框架,也是结合其他推理类型的“粘合剂”。这能让我们时刻注意大脑中大量的信息,以及我们从感官接受到的海量数据中的相关内容。

但问题在于,人工智能界对溯因推理的关注还很少。

人工智能与溯因推理


20 世纪 80 年代和 90 年代,由于溯因逻辑程序(Abductive Logic Programming)的尝试,溯因进入了人工智能的讨论中,但是这些努力都存在缺陷,最终被放弃。Larson 告诉 TechTalks:“它们是对逻辑编程的重新表述,是演绎的一种变体。”


Erik J. Larson,《人工智能的神话》一书作者。


溯因在 2010 年代得到了另一个机会,那就是贝叶斯网络,它是试图计算因果关系的推理引擎。但是,与早期的方法一样,较新的方法也有一个缺陷,它不能捕捉到真正的溯因,Larson 说,贝叶斯和其他图形模型都是“归纳法的变种”。他在《人工智能的神话》一书中称它们为“名副其实的溯因”。

在很大程度上,人工智能的历史都以演绎和归纳为主导。


“当早期人工智能先驱 Alan Newell、Herbert Simon、John McCarthy 和 Marvin Minsky 开始着手解决人工推理(人工智能的核心)问题时,他们认为编写演绎式规则就足以产生智能思维和行动,”Larson 说,“事实上事实并非如此,在关于我们如何做科学的讨论中,这一点应该更早被认识到。”“这太奇怪了,没有人真的停下来,明确地说‘等等,这是行不通的!’” Larson 说,“这将使研究直接转向溯因或假设的生成,或者说,‘上下文敏感推理’。”


在过去的二十年里,随着数据和计算资源的日益丰富,机器学习算法——特别是深度神经网络——已经成为人工智能领域的研究热点。深度学习技术开启了以前超出计算机极限的应用。这也吸引了世界上一些最富有的公司的兴趣和资金。


Larson 说:“我认为,随着万维网的出现,经验式或归纳式(以数据为中心)的方法占据了上风,而溯因法和演绎法一样,基本上被遗忘了。”


但是,机器学习系统也存在严重的局限性,包括缺乏因果关系,边缘情况处理不好和对数据的需求过多。同时,随着研究人员尝试将机器学习应用到医疗和金融等敏感领域,这些限制正变得越来越明显,问题也越来越多。

溯因推理与人工智能的未来之路


包括强化学习先驱 Richard Sutton 在内的一些科学家认为,我们应该坚持使用能够随着数据和计算的可用性而扩展的方法,即学习和搜索。举例来说,随着神经网络的规模越来越大,数据也越来越丰富,它们最终会超越极限,带来新的突破。


Larson 驳斥了数据驱动的人工智能的大规模应用,认为“作为一种智能模型,其本质是有缺陷的”。他重申,尽管搜索和学习都可以提供有用的应用,但是它们是基于非溯因推理。


“如果没有推理思维的革命,搜索就无法扩展到常识或溯因推理中,而这还没有发生。与机器学习类似,学习方法的数据驱动特性意味着推理必须来自数据,可以说,人们经常进行的许多智能推理显然不是这样的,”Larson 说,“我们不会仅仅通过观察过去,比如说,从大型数据集中获取的数据,就能弄清楚对未来的结论、思考或者推理。”


另一些科学家认为,混合人工智能将符号系统与神经网络结合起来,将有望克服深度学习的缺陷。IBM Watson 就是一个例子,它在 《危险边缘》(Jeopardy!)美国电视智力问答节目中击败了世界冠军而闻名。最新的概念证明了混合模型在单独的符号人工智能和深度学习表现不佳的应用中有很好的效果


Larson 认为,混合系统可以填补仅靠机器学习或仅靠规则方法的空白。身为自然语言处理领域的研究人员,他目前正致力于将大型与训练语言模型,如 GPT-3,与知识图谱形式的语义网方面的旧工作相结合,以便在搜索、问题回答和其他任务中创造更好的应用。


“但是演绎-归纳组合并不能让我们达到溯因,因为这三种类型的推理在形式上是不同的,所以它们不能相互还原,也不能结合起来得到第三种。”他说。


Larson 在《人工智能的神话》一书中将规避溯因的努力称为“推理陷阱”。


他写道:“不管计算机的速度有多快,单纯的归纳启发技术,比如机器学习,还是不够的。像 Watson 这样的混合系统,也达不到一般的理解,”“在一个开放的场景,如语言理解,这需要关于世界的知识,而溯因是核心和不可替代的。正因为如此,将演绎与归纳策略相结合的尝试总是注定要失败……这一领域需要一个关于溯因的基础理论。与此同时,我们却被困在了陷阱里。”

人工智能的商业化


人工智能社区对数据驱动方法的狭隘关注,使得研究和创新集中于那些拥有海量数据存储和雄厚财力的少数组织。当深度学习成为一种将数据转换成有利可图的产品的有效方式,大型科技公司正陷入雇佣人工智能人才的激烈竞争,他们通过给研究人员提供丰厚的薪酬,使得他们离开学术界。


这一转变使得非营利性实验室和小公司难以参与到人工智能的研究。


Larson 说:“当你将人工智能研发与大型数据集的所有权和控制权联系在一起时,初创企业就会面临进入壁垒,因为他们并不拥有数据。”他补充说,数据驱动的人工智能从本质上讲就是在商业领域创造了“赢家通吃”的局面。


反过来,人工智能的垄断也阻碍了科学研究。由于大型科技公司集中精力创造可以利用其巨大的数据资源以保持竞争优势的应用,没有什么动力去探索其他人工智能方法。这一领域的工作开始倾向于狭隘而有利可图的应用,而忽视了可以带来新发明的努力。


“目前没有人知道如果没有如此庞大的集中式数据集的情况下,人工智能将会是什么样,因此,对于那些想要通过设计出不同、更强大的人工智能来竞争的企业家来说,没有什么真正的机会。”Larson 说。


Larson 在他的书中警告了当前的人工智能文化,“它在不断编织人工智能神话的同时,从低垂的果实中榨取利润。”他写道,通用人工智能进展的假象可能会导致另一个人工智能的冬天


不过,尽管人工智能的冬天可能会抑制人们对深度学习和数据驱动的人工智能的兴趣,但它也能为新一代的思想家探索新的途径开辟道路。Larson 希望科学家们开始超越现有的方法。


Larson 在《人工智能的神话》一书中提供了一种推理框架,它揭示了当今该领域所面临的挑战,并帮助读者看穿通用人工智能或奇点进展的夸大说法。“我的希望是,非专业人士有一些工具与这种非科学的必然想法作斗争,我的同事和其他人工智能科学家将此视为解决这一领域所面临的现实问题的警钟。”


作者介绍:


Ben Dickson,软件工程师,也是 TechTalks 的创始人,作家,撰写关于科技、商业和政治方面的文章。


原文链接:


https://bdtechtalks.com/2021/09/20/myth-of-artificial-intelligence-erik-larson/

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2021-11-16 17:472354

评论

发布
暂无评论
发现更多内容

准备Java面试?中公教育java讲师,死磕原理

Java 程序员 后端

掌握渗透测试,从Web漏洞靶场搭建开始

华为云开发者联盟

测试 渗透测试 漏洞 漏洞靶场 wavsep

你的技术真的到天花板了吗,值得推荐!

Java 程序员 后端

做Java程序员真的没有春天吗,12年高级工程师的“飞升之路”

Java 程序员 后端

全栈系统化的学习路线,基于SpringCloud微服务化开发平台项目

Java 程序员 后端

写给Java软件工程师的3条建议,百度笔试题百度校招面试经验,开源新作

Java 程序员 后端

写给即将正在找工作的Java攻城狮,5分钟搞定

Java 程序员 后端

你想学的都在这里,开课吧java架构师百度云,阿里Java开发面试解答

Java 程序员 后端

分享一点面试小经验,2021吊打面试官系列

Java 程序员 后端

关于Java性能优化的几点建议,图灵学院4期百度网盘,附项目源码

Java 程序员 后端

分享Java资深架构师的成长之路,今日头条面试经历

Java 程序员 后端

分享一波阿里、字节、腾讯、美团等精选大厂面试题,Java面试题整理

Java 程序员 后端

全靠我啃烂了这份2021最新面试题,系统盘点Java开发者必须掌握的知识点

Java 程序员 后端

你连基础的JVM运行时内存布局都忘了,springmvc实战教程

Java 程序员 后端

其实Zookeeper的选举机制也不难理解,今日头条Java后端面试

Java 程序员 后端

写给Java开发的小程序布局指南,震惊

Java 程序员 后端

你有过迷茫吗,java的网络编程教程视频,这些知识点你会吗

Java 程序员 后端

架构实战营-模块一

Aha hello xzy

架构实战营 「架构实战营」

关于SQL书写建议-&索引优化的总结,真香警告

Java 程序员 后端

DoS?DDoS?这件事要从另一个D说起……

郑州埃文科技

网络安全 DOS攻击 IP定位

云栖大会:《永不止步的云上创新》——蒋江伟

代码 科技革命 计算 云 原生云 CTO 云栖大会

你还搞不定分布式系统流控、熔断吗,2021年最新Java面试点梳理

Java 程序员 后端

全套教程百度云,java菜鸟教程多态,Mybatis源码解析

Java 程序员 后端

写给互联网大厂员工的真心话,MySQL优化原理分析及优化方案总结

Java 程序员 后端

分享Java资深架构师的成长之路,Java面试常见问题及回答技巧

Java 程序员 后端

区块链交易隐私如何保证?华为零知识证明技术实战解析

华为云开发者联盟

区块链 金融 零知识证明 同态加密 交易隐私

云图说|初识云数据库GaussDB(for Redis)

华为云开发者联盟

数据库 redis 开源 华为云 GaussDB(for Redis)

关于Java性能优化的几点建议,java编程书籍合集百度云,终局之战

Java 程序员 后端

再见SpringMVC,linux教程第四版实验答案,Java全栈面试题

Java 程序员 后端

分享一次面试经历,享学课堂java架构师课程,【高级Java架构师系统学习】

Java 程序员 后端

入职3个月的Java程序员面临转正,原来SqlSession只是个甩手掌柜

Java 程序员 后端

溯因推理:人工智能的盲点_文化 & 方法_Ben Dickson_InfoQ精选文章