【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

张雷博士谈 IBM 沃森背后的 AI 技术

  • 2011-03-22
  • 本文字数:4186 字

    阅读完需:约 14 分钟

不久前,IBM 超级计算机沃森(Watson)在美国电视智力答题节目《危险边缘(Jeopardy!)》中上演了人机大战,并最终击败两位人类冠军,赢得最后的胜利。沃森由 IBM 全球多个研究院和大学共同研发,历经四年研制而成。IBM 中国研究院也参与了该项目的研发。InfoQ 中文站有幸采访到来自 IBM 中国研究院直接参与了沃森项目的张雷博士。张雷博士是 IBM 中国研究院信息与知识管理部门研究员,在过去的三年中,他和他的研究团队与全球研究团队一起,致力于深度问答项目(DeepQA)的工作,研究并开发了沃森系统。在 IBM 期间他申请过多项专利并获得过 IBM 杰出技术成就奖。在学术领域,张雷博士研究兴趣广泛,涉及语义 Web、知识表示与推理、信息抽取与检索、问题回答系统以及机器学习等,发表学术论文 20 余篇。他是 WWW、IJCAI、ISWC 等重要国际学术会议的程序委员会委员、第九届国际语义网大会(ISWC2010)的本地组织者之一,还是第一届中国语义万维网论坛(CSWS2007)的主要发起人之一。下面有请张博士为我们揭开沃森背后的技术奥秘。

多种 AI 技术的综合运用和强大的计算能力共同造就了沃森

InfoQ:张博士,您好!我想大家都已经通过《Jeopardy!》节目领教到沃森的威力了。从接受人类语言的提问,到用人类语言给出答案,让机器完成这一过程、还要保证相当的正确率,听上去有些不可思议。能否请您举例介绍一下沃森在答题时背后发生了什么?其技术原理是怎样的?

张雷:徐涵,您好!非常高兴能接受您的的采访。沃森在拿到问题后,会进行一系列的计算,包括语法语义分析、对各个知识库进行搜索、提取备选答案、对备选答案证据的搜寻、对证据强度的计算和综合等等。它综合运用了自然语言处理、知识表示与推理、机器学习等技术。我们知道,从单一的知识源或者少数的算法出发,很难让问题回答系统达到接近人类的水平。所以,沃森的主要技术原理是通过搜寻很多知识源,从多角度运用非常多的小算法,对各种可能的答案进行综合判断和学习。这就使得系统依赖少数知识源或少数算法的脆弱性得到了极大的降低,从而大大提高其性能。

InfoQ:14 年前,“深蓝”凭借其大规模计算与枚举能力战胜了国际象棋世界冠军卡斯帕罗夫。如今沃森的成功,有多大程度是依赖于其强大的计算能力,多大程度是依赖人工智能理论本身的发展?

张雷:这两方面应该说都起到了很大的作用。人工智能领域的很多技术都应用在了该系统中,这是很明显的。另一方面,如果没有计算能力的进步,我们在提高计算速度方面可能也会遇到障碍。几年前,沃森在一台不错的服务器上回答一个问题需要 2 个多小时的时间。通过 IBM Power 7 强大的并行化计算能力,才把它压缩到了 3 秒内。另外,强大的计算能力其实也大大加速了开发进程。我们大量使用了 Java 语言和机器学习,而这些都是需要有较强的计算能力作为支撑的。

InfoQ:沃森与同样致力于问题回答的计算知识引擎Wolfram|Alpha ,还有著名的人工智能项目 CYC 有何相同和不同之处?

张雷:据我所知,Wolfram|Alpha 主要依赖于事先由人手工编辑的结构化数据作为知识源,而沃森则以现有的非结构化数据为主,适当辅以一些结构化数据。两者的计算方法也完全不同。我估计 Wolfram|Alpha 是以基于规则的匹配和计算为主,而沃森则是以统计推理为主。和 CYC 相比,沃森并不去构造基于形式逻辑的知识库,而是直接使用现有的用人类语言书写的知识,例如各种百科全书。CYC 以形式化的逻辑推理作为基本的计算方法,而沃森是以统计推理为主。

InfoQ:沃森看上去像是一种决策系统。作为决策系统,它不仅要给出答案,还要提供相关依据。这在沃森系统中是如何做到的?另外,如被告知回答错误,沃森是否具备自我学习和完善的能力?

张雷:沃森系统的一个关键步骤是评价备选答案的可靠性。这个可靠性是由上百个算法从各种不同的角度评价得出的。例如:关键字匹配程度、时间关系的匹配程度、地理位置匹配的程度、类型匹配程度等等。沃森在每一个角度上都能得到量化的可靠性评价。而且这些评价算法所依赖的知识源也是可追溯的。所以,如果需要,沃森可以为用户提供答案的依据。

在沃森参赛之前,它会从历史数据中进行学习。比如,如果它回答错了一个往期节目上的问题,它会从中学习到一些信息。在参赛之时,它主要依赖以前学习的结果,但也进行一些简单的在线学习。例如,它可以从已经被其它选手回答的同一类型问题中归纳出一些特点,指导其回答这类问题。另外,答错题目也会导致沃森调整其游戏策略。因此可以说,沃森具备了初步的自我学习和完善的能力。

语义网技术在沃森中的应用

InfoQ:在沃森系统中,从各处采集而来的海量知识是如何表达和管理的?知识出现不一致时将如何处理?

张雷:非结构化知识主要就是以其原始的文本来表示的,而结构化知识则使用了诸如 RDF 这样的表示和管理方法。知识出现不一致时,沃森通过对大量往期题目的学习来发现哪些是在该游戏中更值得依赖的知识,而哪些在该游戏场景中是不可靠的。

InfoQ:据介绍,沃森采用了包括 RDF/Linked Data 在内的 Semantic Web 技术。沃森为什么会选中这一技术?RDF 及 Linking Open Data 的思想在沃森系统中是如何发挥作用的?

张雷: Linked Data 是非常重要的结构化的知识源。我们在研发沃森的初始阶段就考察了该如何利用这一重要的知识源。我们尝试了使用 Linked Data,特别是 DBpedia IMDb 等,来直接回答比赛中的问题。我们也利用 Linked Data 来帮助沃森对答案的类型进行判断。不仅如此,沃森在很多其它场合也借鉴了一些 RDF 及 Linked Data 的思想。例如,有些从文本中挖掘得到的知识是使用三元组形式表示的;当一个字符串代表的对象有歧义时,使用 URI 来代表不同的对象;利用 RDF 三元组中的谓词作为语义提示等等。

InfoQ:沃森是否还应用了其他 Semantic Web 技术,如本体(ontology)、逻辑推理等?沃森强大的运算能力是否足以应付时间复杂度很高的推理需求?

张雷:沃森应用了本体来帮助其对答案类型进行判断。例如,判断哈利波特是不是文学作品。DBpedia 可能会告诉我们哈利波特是小说,而本体会告诉我们小说是一种文学作品。在沃森系统中,我们应用了简单的基于本体的逻辑推理,例如上下位关系、不相交关系(disjointness) 等。这些简单的逻辑推理可以用简单快速的方法实现。

InfoQ:在本体工程实践中,沃森是如何将 DBPedia、YAGO、Wordnet 等不同的本体结合起来的?涉及到本体映射与转换吗?

张雷:很多本体是分开来单独使用的。因为我们需要沃森能够学习得到这些本体在这个问答环境中的不同的可靠程度。对于 YAGO 和 Wordnet 来说,它们有着天然的对应关系。我们也几乎没有使用其它本体映射和转换。

InfoQ:请否请您简单介绍一下严格语义与浅层语义,以及沃森是如何平衡运用这两种技术的?

张雷:我不知道”严格语义”与“浅层语义”是否有精确的定义。我的理解是:“严格语义”是和符号化的、形式化的逻辑系统相关联的,通常是精确无二义的。每个符号的语义都在逻辑系统中由其它符号精确的解释和定义。“浅层语义”则是和自然语言或者常识相关联的,具有一定的模糊性。两者有不同的适用性。沃森通过使用机器学习的方法,来学习得到该在什么场合应用什么方法。

沃森代表自然语言处理和人工智能技术的突破

InfoQ:随着沃森在《Jeopardy!》中击败人类选手,人工智能再次成为热点话题:有人称沃森是人工智能发展的一个里程碑;有人认为人工智能的前途一片光明;还有一些人则对机器越来越聪明表示担心。相对于人工智能历史上的屡次失败,沃森无疑是一次成功的人工智能实践。作为沃森项目的参与者之一,能否请您谈谈沃森在人工智能实践上的成功经验?人工智能前景如何?还有,您认为对人工智能的担忧有必要吗?

张雷:对于人工智能实践来说,沃森的经验表明依靠单一或少数算法是很难成功的。而依靠大量的各种小算法的集成更容易取得进展。这似乎和生物界的多样性有着相似性。另外,沃森也说明,人工智能技术已经取得了相当大的进展,通过大规模的集成这些技术,很多我们看似很难的问题已经从“不可能解决”变为“可能可以解决”。例如,沃森表明,以前人工智能中的知识获取的瓶颈(knowledge acquisition bottleneck)似乎变成了一个可能可以解决的问题。

对人工智能的担忧在现阶段是没有必要的。我们还没有看到机器具有自我意识。所有的功能都是由人控制和提供的。在现阶段,人工智能技术,包括沃森,是用来帮助人的,而不是取代人的。

InfoQ:沃森除了用于《Jeopardy!》,还可以用于哪些领域?针对其他领域,需要做出哪些额外的努力?有没有什么是沃森不能做的?

张雷:沃森代表的是自然语言处理和人工智能技术的突破,可以应用于很多领域,例如医疗、金融、电信、政府服务等。例如,在医疗领域,医疗记录、文本、杂志和研究资料都以自然语言编写——这是一种传统计算机难以理解的语言。一个可以立即从这些文件中找出准确答案的系统能够给医疗行业带来巨大的改变。IBM 最近宣布与 Nuance 通信公司签署协议,在医疗行业探索、开发沃森计算系统的先进分析能力,并实现其商业化。当然,为了让沃森真正服务于这些领域,可能还需要准备相应的专业知识库等额外的努力。沃森不是万能的,对于具有很大主观性或依赖个人生活经验的问题,沃森现在是不擅长回答的。

沃森的未来

InfoQ:沃森未来是否有 2.0 版本?如果有,下一步会做什么?

张雷:沃森的下一步开发计划主要是将沃森应用在实际生活的各个领域中,例如前面提到的医疗、金融、电信、政府服务等。

InfoQ:像沃森这样的巨型系统,并非一般企业所能拥有,但它提供的服务又是广泛需要的。在这种情况之下,沃森今后会不会考虑提供云服务?

张雷:沃森确实是一个庞大的系统。但具体来说,也就是运行在不到 100 台的 IBM Power7 服务器上。因此,它也并不是可望而不可及的。很多企业和机构已经拥有远不止 100 台服务器。当然,要让沃森服务越来越多数量的问答请求,需要的机器数量会上升。因此,我们也不排除通过云服务的方式来提供沃森。

InfoQ:最后,您能介绍一下 IBM 中国研究院在沃森项目中的主要工作及成果吗?

张雷:IBM 中国研究院在研发沃森系统的过程中,发挥了重要的作用。我们为沃森系统采集、分析和使用各种结构化的知识,利用结构化和高可靠的知识提供问题解答,排除让系统显得“愚蠢”的答案,以及帮助沃森系统提高其学习能力。来自 IBM 中国研究院的很多技术成果已经融入在沃森系统中,而有的研究成果则为整个科研团队提供借鉴和参考。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2011-03-22 11:4312879
用户头像

发布了 63 篇内容, 共 25.1 次阅读, 收获喜欢 11 次。

关注

评论

发布
暂无评论
发现更多内容

深入探讨Python Tornado框架:原理与异步实现

阿呆

Python tornado Web

轻松搞懂云成本优化:FinOps,2023年一定要懂的热点趋势!

博文视点Broadview

“ChatGPT们”的淘金时代

OneFlow

拯救脂肪肝第一步!以飞桨3D医疗影像分割方案MedicalSeg自主诊断脂肪肝

飞桨PaddlePaddle

深度学习 计算机视觉 语义分割 PaddlePaddle

看完这份SpringBoot神级文档,面试真的可以为所欲为

三十而立

Java IT java面试

探索Python Web后端技术的发展之路

阿呆

Activity初窥门径

攻城狮Wayne

android App Activity

职场「OKR」,魔幻又内卷

Java 架构 职场 OKR

MobPush 厂商通道SDK集成指南

MobTech袤博科技

世界备份日|有“备”而来,才能不为数据安全“蕉绿”

云布道师

存储

企业号 4 月 PK 榜,火热开启!

InfoQ写作社区官方

热门活动 企业号 4 月 PK 榜

碳基大模型--人一生处理多少个token?

FN0

人工智能 AIGC ChatGPT

机器学习实战系列[一]:工业蒸汽量预测(最新版本下篇)含特征优化模型融合等

汀丶人工智能

数据挖掘 机器学习 数学建模

个人开发者应该如何选购云服务

光毅

Sync包Mutex的原理阐述

Jack

golang

秒懂算法 | Treap树

TiAmo

数据结构 算法 节点 旋转法

IDC报告:安擎AI服务器同比增长29.2%,三行业位居第一

科技热闻

AIGC时代:未来已来

华为云开发者联盟

人工智能 华为云 AIGC 华为云开发者联盟 企业号 3 月 PK 榜

pulsar:创建更多租户 VS 创建更多namespaces

李code

架构 pulsar 调优 业务

AI又火了,这一次云厂商能赚到钱吗?

脑极体

云计算 AI 云厂商

从人工智能角度看人肉智能

FN0

AIGC

使用 DataEase 展示服务器运行状态

搞大屏的小北

Linux监控 Linux监控脚本 监控展示 监控大屏

AIGC热门技术岗平均年薪超百万,脉脉林凡认为白领可能先于蓝领失业

科技热闻

「高频必考」Docker&K8S面试题和答案

王中阳Go

Docker 高效工作 学习方法 面试题 Go 语言

标星90K,这份Leetcode刷题手册在GitHub爆火!完整版开放下载

架构师之道

Java 编程 算法

易观千帆 | 2023年2月证券APP月活跃用户规模盘点

易观分析

金融 证券 经济

一文读懂HAG:首个永久锚定BTC Mining算力的Security Token

股市老人

一文读懂mysql锁

Paincupid

MySQL MySQL锁 mysql锁原理 mysql如何上锁 msyql锁分类

重现一条简单SQL的优化过程

GreatSQL

MySQL greatsql greatsql社区

电商通用型商品中心设计

京东科技开发者

构架 企业号 3 月 PK 榜 电商中心 SKU 类目

以前端视角,漫谈「云端」

京东科技开发者

云计算 前端 云技术 企业号 3 月 PK 榜

张雷博士谈IBM沃森背后的AI技术_Java_徐涵_InfoQ精选文章