写点什么

张雷博士谈 IBM 沃森背后的 AI 技术

  • 2011-03-22
  • 本文字数:4186 字

    阅读完需:约 14 分钟

不久前,IBM 超级计算机沃森(Watson)在美国电视智力答题节目《危险边缘(Jeopardy!)》中上演了人机大战,并最终击败两位人类冠军,赢得最后的胜利。沃森由 IBM 全球多个研究院和大学共同研发,历经四年研制而成。IBM 中国研究院也参与了该项目的研发。InfoQ 中文站有幸采访到来自 IBM 中国研究院直接参与了沃森项目的张雷博士。张雷博士是 IBM 中国研究院信息与知识管理部门研究员,在过去的三年中,他和他的研究团队与全球研究团队一起,致力于深度问答项目(DeepQA)的工作,研究并开发了沃森系统。在 IBM 期间他申请过多项专利并获得过 IBM 杰出技术成就奖。在学术领域,张雷博士研究兴趣广泛,涉及语义 Web、知识表示与推理、信息抽取与检索、问题回答系统以及机器学习等,发表学术论文 20 余篇。他是 WWW、IJCAI、ISWC 等重要国际学术会议的程序委员会委员、第九届国际语义网大会(ISWC2010)的本地组织者之一,还是第一届中国语义万维网论坛(CSWS2007)的主要发起人之一。下面有请张博士为我们揭开沃森背后的技术奥秘。

多种 AI 技术的综合运用和强大的计算能力共同造就了沃森

InfoQ:张博士,您好!我想大家都已经通过《Jeopardy!》节目领教到沃森的威力了。从接受人类语言的提问,到用人类语言给出答案,让机器完成这一过程、还要保证相当的正确率,听上去有些不可思议。能否请您举例介绍一下沃森在答题时背后发生了什么?其技术原理是怎样的?

张雷:徐涵,您好!非常高兴能接受您的的采访。沃森在拿到问题后,会进行一系列的计算,包括语法语义分析、对各个知识库进行搜索、提取备选答案、对备选答案证据的搜寻、对证据强度的计算和综合等等。它综合运用了自然语言处理、知识表示与推理、机器学习等技术。我们知道,从单一的知识源或者少数的算法出发,很难让问题回答系统达到接近人类的水平。所以,沃森的主要技术原理是通过搜寻很多知识源,从多角度运用非常多的小算法,对各种可能的答案进行综合判断和学习。这就使得系统依赖少数知识源或少数算法的脆弱性得到了极大的降低,从而大大提高其性能。

InfoQ:14 年前,“深蓝”凭借其大规模计算与枚举能力战胜了国际象棋世界冠军卡斯帕罗夫。如今沃森的成功,有多大程度是依赖于其强大的计算能力,多大程度是依赖人工智能理论本身的发展?

张雷:这两方面应该说都起到了很大的作用。人工智能领域的很多技术都应用在了该系统中,这是很明显的。另一方面,如果没有计算能力的进步,我们在提高计算速度方面可能也会遇到障碍。几年前,沃森在一台不错的服务器上回答一个问题需要 2 个多小时的时间。通过 IBM Power 7 强大的并行化计算能力,才把它压缩到了 3 秒内。另外,强大的计算能力其实也大大加速了开发进程。我们大量使用了 Java 语言和机器学习,而这些都是需要有较强的计算能力作为支撑的。

InfoQ:沃森与同样致力于问题回答的计算知识引擎Wolfram|Alpha ,还有著名的人工智能项目 CYC 有何相同和不同之处?

张雷:据我所知,Wolfram|Alpha 主要依赖于事先由人手工编辑的结构化数据作为知识源,而沃森则以现有的非结构化数据为主,适当辅以一些结构化数据。两者的计算方法也完全不同。我估计 Wolfram|Alpha 是以基于规则的匹配和计算为主,而沃森则是以统计推理为主。和 CYC 相比,沃森并不去构造基于形式逻辑的知识库,而是直接使用现有的用人类语言书写的知识,例如各种百科全书。CYC 以形式化的逻辑推理作为基本的计算方法,而沃森是以统计推理为主。

InfoQ:沃森看上去像是一种决策系统。作为决策系统,它不仅要给出答案,还要提供相关依据。这在沃森系统中是如何做到的?另外,如被告知回答错误,沃森是否具备自我学习和完善的能力?

张雷:沃森系统的一个关键步骤是评价备选答案的可靠性。这个可靠性是由上百个算法从各种不同的角度评价得出的。例如:关键字匹配程度、时间关系的匹配程度、地理位置匹配的程度、类型匹配程度等等。沃森在每一个角度上都能得到量化的可靠性评价。而且这些评价算法所依赖的知识源也是可追溯的。所以,如果需要,沃森可以为用户提供答案的依据。

在沃森参赛之前,它会从历史数据中进行学习。比如,如果它回答错了一个往期节目上的问题,它会从中学习到一些信息。在参赛之时,它主要依赖以前学习的结果,但也进行一些简单的在线学习。例如,它可以从已经被其它选手回答的同一类型问题中归纳出一些特点,指导其回答这类问题。另外,答错题目也会导致沃森调整其游戏策略。因此可以说,沃森具备了初步的自我学习和完善的能力。

语义网技术在沃森中的应用

InfoQ:在沃森系统中,从各处采集而来的海量知识是如何表达和管理的?知识出现不一致时将如何处理?

张雷:非结构化知识主要就是以其原始的文本来表示的,而结构化知识则使用了诸如 RDF 这样的表示和管理方法。知识出现不一致时,沃森通过对大量往期题目的学习来发现哪些是在该游戏中更值得依赖的知识,而哪些在该游戏场景中是不可靠的。

InfoQ:据介绍,沃森采用了包括 RDF/Linked Data 在内的 Semantic Web 技术。沃森为什么会选中这一技术?RDF 及 Linking Open Data 的思想在沃森系统中是如何发挥作用的?

张雷: Linked Data 是非常重要的结构化的知识源。我们在研发沃森的初始阶段就考察了该如何利用这一重要的知识源。我们尝试了使用 Linked Data,特别是 DBpedia IMDb 等,来直接回答比赛中的问题。我们也利用 Linked Data 来帮助沃森对答案的类型进行判断。不仅如此,沃森在很多其它场合也借鉴了一些 RDF 及 Linked Data 的思想。例如,有些从文本中挖掘得到的知识是使用三元组形式表示的;当一个字符串代表的对象有歧义时,使用 URI 来代表不同的对象;利用 RDF 三元组中的谓词作为语义提示等等。

InfoQ:沃森是否还应用了其他 Semantic Web 技术,如本体(ontology)、逻辑推理等?沃森强大的运算能力是否足以应付时间复杂度很高的推理需求?

张雷:沃森应用了本体来帮助其对答案类型进行判断。例如,判断哈利波特是不是文学作品。DBpedia 可能会告诉我们哈利波特是小说,而本体会告诉我们小说是一种文学作品。在沃森系统中,我们应用了简单的基于本体的逻辑推理,例如上下位关系、不相交关系(disjointness) 等。这些简单的逻辑推理可以用简单快速的方法实现。

InfoQ:在本体工程实践中,沃森是如何将 DBPedia、YAGO、Wordnet 等不同的本体结合起来的?涉及到本体映射与转换吗?

张雷:很多本体是分开来单独使用的。因为我们需要沃森能够学习得到这些本体在这个问答环境中的不同的可靠程度。对于 YAGO 和 Wordnet 来说,它们有着天然的对应关系。我们也几乎没有使用其它本体映射和转换。

InfoQ:请否请您简单介绍一下严格语义与浅层语义,以及沃森是如何平衡运用这两种技术的?

张雷:我不知道”严格语义”与“浅层语义”是否有精确的定义。我的理解是:“严格语义”是和符号化的、形式化的逻辑系统相关联的,通常是精确无二义的。每个符号的语义都在逻辑系统中由其它符号精确的解释和定义。“浅层语义”则是和自然语言或者常识相关联的,具有一定的模糊性。两者有不同的适用性。沃森通过使用机器学习的方法,来学习得到该在什么场合应用什么方法。

沃森代表自然语言处理和人工智能技术的突破

InfoQ:随着沃森在《Jeopardy!》中击败人类选手,人工智能再次成为热点话题:有人称沃森是人工智能发展的一个里程碑;有人认为人工智能的前途一片光明;还有一些人则对机器越来越聪明表示担心。相对于人工智能历史上的屡次失败,沃森无疑是一次成功的人工智能实践。作为沃森项目的参与者之一,能否请您谈谈沃森在人工智能实践上的成功经验?人工智能前景如何?还有,您认为对人工智能的担忧有必要吗?

张雷:对于人工智能实践来说,沃森的经验表明依靠单一或少数算法是很难成功的。而依靠大量的各种小算法的集成更容易取得进展。这似乎和生物界的多样性有着相似性。另外,沃森也说明,人工智能技术已经取得了相当大的进展,通过大规模的集成这些技术,很多我们看似很难的问题已经从“不可能解决”变为“可能可以解决”。例如,沃森表明,以前人工智能中的知识获取的瓶颈(knowledge acquisition bottleneck)似乎变成了一个可能可以解决的问题。

对人工智能的担忧在现阶段是没有必要的。我们还没有看到机器具有自我意识。所有的功能都是由人控制和提供的。在现阶段,人工智能技术,包括沃森,是用来帮助人的,而不是取代人的。

InfoQ:沃森除了用于《Jeopardy!》,还可以用于哪些领域?针对其他领域,需要做出哪些额外的努力?有没有什么是沃森不能做的?

张雷:沃森代表的是自然语言处理和人工智能技术的突破,可以应用于很多领域,例如医疗、金融、电信、政府服务等。例如,在医疗领域,医疗记录、文本、杂志和研究资料都以自然语言编写——这是一种传统计算机难以理解的语言。一个可以立即从这些文件中找出准确答案的系统能够给医疗行业带来巨大的改变。IBM 最近宣布与 Nuance 通信公司签署协议,在医疗行业探索、开发沃森计算系统的先进分析能力,并实现其商业化。当然,为了让沃森真正服务于这些领域,可能还需要准备相应的专业知识库等额外的努力。沃森不是万能的,对于具有很大主观性或依赖个人生活经验的问题,沃森现在是不擅长回答的。

沃森的未来

InfoQ:沃森未来是否有 2.0 版本?如果有,下一步会做什么?

张雷:沃森的下一步开发计划主要是将沃森应用在实际生活的各个领域中,例如前面提到的医疗、金融、电信、政府服务等。

InfoQ:像沃森这样的巨型系统,并非一般企业所能拥有,但它提供的服务又是广泛需要的。在这种情况之下,沃森今后会不会考虑提供云服务?

张雷:沃森确实是一个庞大的系统。但具体来说,也就是运行在不到 100 台的 IBM Power7 服务器上。因此,它也并不是可望而不可及的。很多企业和机构已经拥有远不止 100 台服务器。当然,要让沃森服务越来越多数量的问答请求,需要的机器数量会上升。因此,我们也不排除通过云服务的方式来提供沃森。

InfoQ:最后,您能介绍一下 IBM 中国研究院在沃森项目中的主要工作及成果吗?

张雷:IBM 中国研究院在研发沃森系统的过程中,发挥了重要的作用。我们为沃森系统采集、分析和使用各种结构化的知识,利用结构化和高可靠的知识提供问题解答,排除让系统显得“愚蠢”的答案,以及帮助沃森系统提高其学习能力。来自 IBM 中国研究院的很多技术成果已经融入在沃森系统中,而有的研究成果则为整个科研团队提供借鉴和参考。

2011-03-22 11:4313887
用户头像

发布了 63 篇内容, 共 28.0 次阅读, 收获喜欢 11 次。

关注

评论

发布
暂无评论
发现更多内容

深入理解Java虚拟机第三版,通俗易懂,大牛带你轻松搞懂JVM性能调优

Java架构之路

Java 程序员 架构 面试 编程语言

【性能优化】纳尼?内存又溢出了?!是时候总结一波了!!

冰河

性能优化 内存泄露 高并发 高性能 内存溢出

Week 5命题作业

balsamspear

极客大学架构师训练营

Nginx-技术专题-入门教程

码界西柚

大数据处理黑科技:揭秘PB级数仓GaussDB(DWS) 并行计算技术

华为云开发者联盟

数据库 并行算子 计算

书写高质量SQL的30条建议

诸葛小猿

MySQL SQL优化

配置企业管理系统,什么样的工作流才有用

雯雯写代码

工作流 企业管理系统

央行数字货币为人民币国际化之路提供推动力

CECBC

数字货币

区块链+能源 大放异彩

CECBC

区块链 能源

darknet A版安装

Dreamer

Week 5学习总结

balsamspear

极客大学架构师训练营

《MySQL开发者SQL权威指南》.pdf

田维常

电子书

面试大厂被算法难倒惨遭滑铁卢?这份字节内部大佬整理的《数据结构与算法》学习笔记你一定要看看!

Java架构之路

Java 程序员 架构 面试 编程语言

「混合云」会是云计算的下一个战场吗?

ToB行业头条

阿里云

甲方日常 45

句子

工作 随笔杂谈 日常

DDIA 读书笔记(5)数据分区方案

莫黎

读书笔记

聆听无声的话语:手把手教你用ModelArts实现手语识别

华为云开发者联盟

AI 图像识别 手语

架构师第一期作业(第 7 周)

Cheer

课程作业

还在为算法烦恼?那你应该还没看过这份Git上70k标星的笔记

Java架构师迁哥

high-performance-tidb-challenge 记录

程序员老王

Dubbo-go Server端开启服务过程

apache/dubbo-go

dubbo dubbo-go dubbogo

阿里云视频云技术专家 LVS 演讲全文:《“云端一体”的智能媒体生产制作演进之路》

阿里云CloudImagine

媒体 音视频

架构师训练营第一期 - week7

习习

在深夜加油站遇见哈利波特

脑极体

Week 7 命题作业

阿泰

天源迪科受邀出席“第四届央企电商化采购发展高峰论坛"

DT极客

直播预告 | 应用加固防破解,4.1折就够了

蚂蚁集团移动开发平台 mPaaS

安全攻防 App风险 mPaaS

银行数字化转型:需建立起以体验为核心、数据为基础、技术为驱动的架构体系

CECBC

银行 数字经济

Android 一行代码接入 扫码 生成码

Java android kotlin zxing camera

《Python源码剖析》.pdf

田维常

电子书

《Java Web企业项目实战》.pdf

田维常

电子书

张雷博士谈IBM沃森背后的AI技术_Java_徐涵_InfoQ精选文章