IBM AI辩手对战世界级人类辩手，炒作还是秀肌肉？-InfoQ

北京时间 2 月 12 日早上 9：00，一场特殊的辩论赛在美国举行，IBM 研发的 AI 辩手 Project Debater 迎战人类辩手。四次荣获艾美奖，同时也是辩论节目“Intelligence Squared”主持人，John Donovan 主持本次比赛。经过将近 1 小时的激辩，比赛最终以人类选手获胜而落下帷幕。以下是详细报道。

“机”不如人，AI 辩论尚差火候

主持人 John Donvan

人机辩论赛的规则是这样的：参赛双方在赛前均不知道辩论的题目，所以选手无法进行提前准备，这也就增加了比赛的难度，最终的结论将由观众以投票的方式进行判决。

Project Debater 与 Harish Natarajan

辩论的话题为：是否应该对学前教育进行补贴。人类辩手 Harish Natarajan 迎战，Harish 是剑桥大学的硕士生，曾在牛津大学获得政治、哲学和经济学学士学位，目前是剑桥联盟协会的现任辩论官，曾获得 2012 年欧洲辩论冠军。

辩论话题：是否应该对学前教育进行补贴

这场辩论赛除了吸引不少现场观众外，还在线上引发了超过 5000 人同时观看及讨论。在比赛刚刚开始的时候，就有好事者问观看的网友：支持 AI 还是人类选手？不知是出于恶搞的目的还是真实的想法，有不少人都为 AI 打 call。

最终的结果可能让他们失望了，人类辩手守住了辩论领域的疆土，人工智能暂时无法在这一领域击败人类。不过，Project Debater 凭借强大丰富的知识库，让观众学到了更多的知识，在这一方面仍旧获得了较高的票数。

但是在一些观众来看，这场比赛仍旧是炒作大于实用的一场秀。

有网友评论道：辩论比赛本就带有较强的主观性，最终的比赛结果由观众投票决定，就这一点上来说，人为操作的可能性就增加了不少。如果一开始不告诉观众哪一方是 AI，通过匿名展示的方式进行辩论以及投票，或许更能体现出 AI 的水平。

AI 辩手：噱头 or 实用产品？

说起 IBM 的 Project Debater，作为一个 AI 辩手，这并不是它首次与人类辩手比赛。

Project Debater 于 2018 年首次亮相，当时它与两名人类辩论家 Noa Ovadia 和 Dan Zafrir 进行了辩论。主题分别是：“是否应该补贴太空探索费用”和“是否应该增加远程医疗的使用”。在那场比赛的过程中，Project Debater 不仅能够与其对手进行辩论，甚至可以与辩手开玩笑，并最终赢得了比赛。

在 CES 2019 大会上，IBM 也将 Project Debater 进行了展示，研发人员表示：众包演讲（Speech By Crowd）的应用前景很是广泛，小至训练校园辩论队、大至准备诉讼案件的论证，都可以在 AI 的帮助下完成。

研发人员认为，Project Debater 代表了一种新的 AI 挑战，因为 AlphaGo 相比，辩论是更具开放性的活动，这种根本差异具有重要意义。在复杂的棋盘游戏中，AI 系统可能会提出任何确保获胜的策略，即使一些棋路不能被人类所理解，而在辩论中，情况则完全不同，人工智能系统必须适应人类理性，并提出人类可以遵循和理解的推理路线。

其次，与之前的棋类挑战形成鲜明对比的是，在辩论中，AI 系统无法依赖自然评分功能。个人行动的价值，即论据，往往具有内在的主观性；此外，甚至没有商定的客观指标来确定谁是赢家。Project Debater 证明人工智能可以在这个未知领域发挥重要作用，研发人员相信它将实现一种新颖的决策形式，将人与机器协同结合，让人们做出更明智的决策。

为了开发 Project Debater，IBM 研究团队必须赋予系统三个功能，每个功能都在 AI 中开辟了新天地：

1）数据驱动的语音写作和交付： Project Debater 能够消化大量语料库，并且给出一个有争议的主题的简短描述，写出结构良好的语音，并以清晰的方式进行表述，甚至在适当的时候加入幽默元素。

2）听力理解：识别对手长期连续口语中隐藏的关键概念和主张的观点。

3）对人类困境进行建模：以独特的知识表示模拟人类争议和困境，使系统能够根据需要提供原则性的论据。

专家观点：有意义的开始，仅限于开始

为了给各位读者更加深度的解读这场比赛，我们采访到了海知智能 CEO 谢殿侠先生，作为同行，谢殿侠老师也观看了这场比赛，在他看来，Project Debater 项目是个有意义的开始，但是也仅限于开始。

他认为，从积极的方面来看，Project Debater 对于长句子内容的语音识别、语义理解都是有一定进步的，它可以通过对海量语料进行搜索，从而抽取事实，形成一定的逻辑，对于具体观点可以推理判断与决策，这样的尝试是有意义的。

但是，这一切的前提是：仅限于命题辩论。

8 分钟的发言，Project Debater 或许可以通过搜索进行文字匹配，促成有一定观点的回复，但是本质上来说，它并没有真正理解对手的论点和论据，普适性不够强，如果遇到开放性主题，最终呈现的效果可能差别会非常之大。

谢殿侠告诉我们，如果用棋类比赛的 AI 进行类比，目前的 Project Debater 就像早期的国际象棋选手“深蓝”，通过算力可以计算出一些结果，但是也仅限于国际象棋领域。如果遇到围棋这样充满变化的棋类游戏，深蓝或许也会“歇菜”，只有 AlphaGo 这样拥有学习能力，可以自我升级的 AI 才会称霸围棋游戏。

谢殿侠说，对于 Project Debater 这类 AI 来说，最终的发展目标是能够“自由辩论”的境界，然而受限于目前的技术，几乎没有一款 AI 产品达到这个位置，所以 Project Debater 是一个有意义的开始，但是能够真正达到人类辩手的水平，仍需要努力。

参考链接：

https://www.cbronline.com/opinion/project-debater-ai

https://edition.cnn.com/2019/02/11/tech/ai-versus-human-ibm-debate/index.html

发布

暂无评论

IBM AI辩手对战世界级人类辩手，炒作还是秀肌肉？

“机”不如人，AI 辩论尚差火候

AI 辩手：噱头 or 实用产品？

专家观点：有意义的开始，仅限于开始

评论

第三周作业一

个人数字人民币钱包即将亮相

肝到头秃！阿里爆款的顶配版Spring Security笔记

Kubeless 如何基于 CPU 自动伸缩？ | 玩转 Kubeless

典型的大型互联网系统使用了哪些技术方案和手段，主要解决什么问题？

拜托，学妹，别再问我怎么自学 Java 了！和盘托出

国外的公司都是如何对待大龄程序员的？在国内该如何应对？

区块链 | 最火的七大职业了解一下

中国银行正式启动区块链产业金融服务项目

【第四周】系统架构

Programmatic Navigation using SwiftUI| 使用SwiftUI进行程序化导航

来喽，来喽，Python 3.9正式版发布了~~~

图解 K8S 源码 - Informer 篇

The story of programmers in famous enterprises.

华为云专家讲述知识图谱构建流程及方法

我和我的智能联接

服务器的发展历史

图扑软件联手阿里Lindorm数据库开启工业物联超融合存储模式

高难度对话读书笔记—聆听篇

OKR-VUCA时代目标管理利器实践分享

苦难过后，终会团聚

在线教育企业迎来“秋招”大考，数字用户体验成胜负关键手

LeetCode题解：94. 二叉树的中序遍历，使用栈，JavaScript，详细注释

有了TA，领域外企业里的小IT团队，也能轻松搞定大型项目

OpLog4j

亚马逊Prime会员日火爆开启一站购全球逾3000万正品商品

翻译之深入注释俄罗斯民间故事的语料库，以实现对俄罗斯形式主义理论的机器学习

JVM-技术专题-类加载机制

JVM-技术专题-Java类文件结构

从哲学源头思考自动驾驶网络架构设计

年轻人大企打拼多年，刚升迁便遇巨大阻力难以解决，到底如何才能在职场中幸存？

IBM AI辩手对战世界级人类辩手，炒作还是秀肌肉？

“机”不如人，AI 辩论尚差火候

AI 辩手：噱头 or 实用产品？

专家观点：有意义的开始，仅限于开始

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载