【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

张雷博士谈 IBM 沃森背后的 AI 技术

  • 2011-03-22
  • 本文字数:4186 字

    阅读完需:约 14 分钟

不久前,IBM 超级计算机沃森(Watson)在美国电视智力答题节目《危险边缘(Jeopardy!)》中上演了人机大战,并最终击败两位人类冠军,赢得最后的胜利。沃森由 IBM 全球多个研究院和大学共同研发,历经四年研制而成。IBM 中国研究院也参与了该项目的研发。InfoQ 中文站有幸采访到来自 IBM 中国研究院直接参与了沃森项目的张雷博士。张雷博士是 IBM 中国研究院信息与知识管理部门研究员,在过去的三年中,他和他的研究团队与全球研究团队一起,致力于深度问答项目(DeepQA)的工作,研究并开发了沃森系统。在 IBM 期间他申请过多项专利并获得过 IBM 杰出技术成就奖。在学术领域,张雷博士研究兴趣广泛,涉及语义 Web、知识表示与推理、信息抽取与检索、问题回答系统以及机器学习等,发表学术论文 20 余篇。他是 WWW、IJCAI、ISWC 等重要国际学术会议的程序委员会委员、第九届国际语义网大会(ISWC2010)的本地组织者之一,还是第一届中国语义万维网论坛(CSWS2007)的主要发起人之一。下面有请张博士为我们揭开沃森背后的技术奥秘。

多种 AI 技术的综合运用和强大的计算能力共同造就了沃森

InfoQ:张博士,您好!我想大家都已经通过《Jeopardy!》节目领教到沃森的威力了。从接受人类语言的提问,到用人类语言给出答案,让机器完成这一过程、还要保证相当的正确率,听上去有些不可思议。能否请您举例介绍一下沃森在答题时背后发生了什么?其技术原理是怎样的?

张雷:徐涵,您好!非常高兴能接受您的的采访。沃森在拿到问题后,会进行一系列的计算,包括语法语义分析、对各个知识库进行搜索、提取备选答案、对备选答案证据的搜寻、对证据强度的计算和综合等等。它综合运用了自然语言处理、知识表示与推理、机器学习等技术。我们知道,从单一的知识源或者少数的算法出发,很难让问题回答系统达到接近人类的水平。所以,沃森的主要技术原理是通过搜寻很多知识源,从多角度运用非常多的小算法,对各种可能的答案进行综合判断和学习。这就使得系统依赖少数知识源或少数算法的脆弱性得到了极大的降低,从而大大提高其性能。

InfoQ:14 年前,“深蓝”凭借其大规模计算与枚举能力战胜了国际象棋世界冠军卡斯帕罗夫。如今沃森的成功,有多大程度是依赖于其强大的计算能力,多大程度是依赖人工智能理论本身的发展?

张雷:这两方面应该说都起到了很大的作用。人工智能领域的很多技术都应用在了该系统中,这是很明显的。另一方面,如果没有计算能力的进步,我们在提高计算速度方面可能也会遇到障碍。几年前,沃森在一台不错的服务器上回答一个问题需要 2 个多小时的时间。通过 IBM Power 7 强大的并行化计算能力,才把它压缩到了 3 秒内。另外,强大的计算能力其实也大大加速了开发进程。我们大量使用了 Java 语言和机器学习,而这些都是需要有较强的计算能力作为支撑的。

InfoQ:沃森与同样致力于问题回答的计算知识引擎Wolfram|Alpha ,还有著名的人工智能项目 CYC 有何相同和不同之处?

张雷:据我所知,Wolfram|Alpha 主要依赖于事先由人手工编辑的结构化数据作为知识源,而沃森则以现有的非结构化数据为主,适当辅以一些结构化数据。两者的计算方法也完全不同。我估计 Wolfram|Alpha 是以基于规则的匹配和计算为主,而沃森则是以统计推理为主。和 CYC 相比,沃森并不去构造基于形式逻辑的知识库,而是直接使用现有的用人类语言书写的知识,例如各种百科全书。CYC 以形式化的逻辑推理作为基本的计算方法,而沃森是以统计推理为主。

InfoQ:沃森看上去像是一种决策系统。作为决策系统,它不仅要给出答案,还要提供相关依据。这在沃森系统中是如何做到的?另外,如被告知回答错误,沃森是否具备自我学习和完善的能力?

张雷:沃森系统的一个关键步骤是评价备选答案的可靠性。这个可靠性是由上百个算法从各种不同的角度评价得出的。例如:关键字匹配程度、时间关系的匹配程度、地理位置匹配的程度、类型匹配程度等等。沃森在每一个角度上都能得到量化的可靠性评价。而且这些评价算法所依赖的知识源也是可追溯的。所以,如果需要,沃森可以为用户提供答案的依据。

在沃森参赛之前,它会从历史数据中进行学习。比如,如果它回答错了一个往期节目上的问题,它会从中学习到一些信息。在参赛之时,它主要依赖以前学习的结果,但也进行一些简单的在线学习。例如,它可以从已经被其它选手回答的同一类型问题中归纳出一些特点,指导其回答这类问题。另外,答错题目也会导致沃森调整其游戏策略。因此可以说,沃森具备了初步的自我学习和完善的能力。

语义网技术在沃森中的应用

InfoQ:在沃森系统中,从各处采集而来的海量知识是如何表达和管理的?知识出现不一致时将如何处理?

张雷:非结构化知识主要就是以其原始的文本来表示的,而结构化知识则使用了诸如 RDF 这样的表示和管理方法。知识出现不一致时,沃森通过对大量往期题目的学习来发现哪些是在该游戏中更值得依赖的知识,而哪些在该游戏场景中是不可靠的。

InfoQ:据介绍,沃森采用了包括 RDF/Linked Data 在内的 Semantic Web 技术。沃森为什么会选中这一技术?RDF 及 Linking Open Data 的思想在沃森系统中是如何发挥作用的?

张雷: Linked Data 是非常重要的结构化的知识源。我们在研发沃森的初始阶段就考察了该如何利用这一重要的知识源。我们尝试了使用 Linked Data,特别是 DBpedia IMDb 等,来直接回答比赛中的问题。我们也利用 Linked Data 来帮助沃森对答案的类型进行判断。不仅如此,沃森在很多其它场合也借鉴了一些 RDF 及 Linked Data 的思想。例如,有些从文本中挖掘得到的知识是使用三元组形式表示的;当一个字符串代表的对象有歧义时,使用 URI 来代表不同的对象;利用 RDF 三元组中的谓词作为语义提示等等。

InfoQ:沃森是否还应用了其他 Semantic Web 技术,如本体(ontology)、逻辑推理等?沃森强大的运算能力是否足以应付时间复杂度很高的推理需求?

张雷:沃森应用了本体来帮助其对答案类型进行判断。例如,判断哈利波特是不是文学作品。DBpedia 可能会告诉我们哈利波特是小说,而本体会告诉我们小说是一种文学作品。在沃森系统中,我们应用了简单的基于本体的逻辑推理,例如上下位关系、不相交关系(disjointness) 等。这些简单的逻辑推理可以用简单快速的方法实现。

InfoQ:在本体工程实践中,沃森是如何将 DBPedia、YAGO、Wordnet 等不同的本体结合起来的?涉及到本体映射与转换吗?

张雷:很多本体是分开来单独使用的。因为我们需要沃森能够学习得到这些本体在这个问答环境中的不同的可靠程度。对于 YAGO 和 Wordnet 来说,它们有着天然的对应关系。我们也几乎没有使用其它本体映射和转换。

InfoQ:请否请您简单介绍一下严格语义与浅层语义,以及沃森是如何平衡运用这两种技术的?

张雷:我不知道”严格语义”与“浅层语义”是否有精确的定义。我的理解是:“严格语义”是和符号化的、形式化的逻辑系统相关联的,通常是精确无二义的。每个符号的语义都在逻辑系统中由其它符号精确的解释和定义。“浅层语义”则是和自然语言或者常识相关联的,具有一定的模糊性。两者有不同的适用性。沃森通过使用机器学习的方法,来学习得到该在什么场合应用什么方法。

沃森代表自然语言处理和人工智能技术的突破

InfoQ:随着沃森在《Jeopardy!》中击败人类选手,人工智能再次成为热点话题:有人称沃森是人工智能发展的一个里程碑;有人认为人工智能的前途一片光明;还有一些人则对机器越来越聪明表示担心。相对于人工智能历史上的屡次失败,沃森无疑是一次成功的人工智能实践。作为沃森项目的参与者之一,能否请您谈谈沃森在人工智能实践上的成功经验?人工智能前景如何?还有,您认为对人工智能的担忧有必要吗?

张雷:对于人工智能实践来说,沃森的经验表明依靠单一或少数算法是很难成功的。而依靠大量的各种小算法的集成更容易取得进展。这似乎和生物界的多样性有着相似性。另外,沃森也说明,人工智能技术已经取得了相当大的进展,通过大规模的集成这些技术,很多我们看似很难的问题已经从“不可能解决”变为“可能可以解决”。例如,沃森表明,以前人工智能中的知识获取的瓶颈(knowledge acquisition bottleneck)似乎变成了一个可能可以解决的问题。

对人工智能的担忧在现阶段是没有必要的。我们还没有看到机器具有自我意识。所有的功能都是由人控制和提供的。在现阶段,人工智能技术,包括沃森,是用来帮助人的,而不是取代人的。

InfoQ:沃森除了用于《Jeopardy!》,还可以用于哪些领域?针对其他领域,需要做出哪些额外的努力?有没有什么是沃森不能做的?

张雷:沃森代表的是自然语言处理和人工智能技术的突破,可以应用于很多领域,例如医疗、金融、电信、政府服务等。例如,在医疗领域,医疗记录、文本、杂志和研究资料都以自然语言编写——这是一种传统计算机难以理解的语言。一个可以立即从这些文件中找出准确答案的系统能够给医疗行业带来巨大的改变。IBM 最近宣布与 Nuance 通信公司签署协议,在医疗行业探索、开发沃森计算系统的先进分析能力,并实现其商业化。当然,为了让沃森真正服务于这些领域,可能还需要准备相应的专业知识库等额外的努力。沃森不是万能的,对于具有很大主观性或依赖个人生活经验的问题,沃森现在是不擅长回答的。

沃森的未来

InfoQ:沃森未来是否有 2.0 版本?如果有,下一步会做什么?

张雷:沃森的下一步开发计划主要是将沃森应用在实际生活的各个领域中,例如前面提到的医疗、金融、电信、政府服务等。

InfoQ:像沃森这样的巨型系统,并非一般企业所能拥有,但它提供的服务又是广泛需要的。在这种情况之下,沃森今后会不会考虑提供云服务?

张雷:沃森确实是一个庞大的系统。但具体来说,也就是运行在不到 100 台的 IBM Power7 服务器上。因此,它也并不是可望而不可及的。很多企业和机构已经拥有远不止 100 台服务器。当然,要让沃森服务越来越多数量的问答请求,需要的机器数量会上升。因此,我们也不排除通过云服务的方式来提供沃森。

InfoQ:最后,您能介绍一下 IBM 中国研究院在沃森项目中的主要工作及成果吗?

张雷:IBM 中国研究院在研发沃森系统的过程中,发挥了重要的作用。我们为沃森系统采集、分析和使用各种结构化的知识,利用结构化和高可靠的知识提供问题解答,排除让系统显得“愚蠢”的答案,以及帮助沃森系统提高其学习能力。来自 IBM 中国研究院的很多技术成果已经融入在沃森系统中,而有的研究成果则为整个科研团队提供借鉴和参考。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2011-03-22 11:4312882
用户头像

发布了 63 篇内容, 共 25.1 次阅读, 收获喜欢 11 次。

关注

评论

发布
暂无评论
发现更多内容

MySQL5.5安装教程

小齐写代码

鲲山科技:引入和鲸 ModelWhale,实现量化策略的高效迭代

ModelWhale

数据科学 量化策略 量化分析

企业数字化转型的必选项:集成自动化

RestCloud

APPlink

MetaGPT( The Multi-Agent Framework):颠覆AI开发的革命性多智能体元编程框架

汀丶人工智能

人工智能 深度强化学习 大语言模型 多智能体

枚举探秘:Java中的神奇力量!

互联网工科生

枚举 java

基于 EventBridge 轻松搭建消息集成应用

阿里巴巴云原生

阿里云 云原生 EventBridge

香港CN2服务器购买与部署全攻略,如何提速你的业务?

一只扑棱蛾子

香港服务器 CN2服务器

云行|乘云而上,“赣”劲十足,天翼云4.0暨赣州算力集群落成!

天翼云开发者社区

云计算 云服务

Apache Doris 2.0.2 版本正式发布!

SelectDB

数据库 大数据 数据仓库 实时数仓 apache doris

No qualifying bean of type

0x5d0de9

java spring-boot

Spring Cloud Gateway:打造可扩展的微服务网关

程序员万金游

#java #微服务 #Spring #SpringCloud

NSDT孪生编辑器助力智慧城市

3D建模设计

智慧城市 数字孪生

以科技力量引领医疗数字化转型,英特尔携手中移动成研院打造边缘融合算力网络解决方案

E科讯

一个“旷世“难题:IT团队的绩效要不要跟企业经营结果挂钩

凌晞

团队管理 高绩效团队

农场游戏源码开发,农场游戏开发教程

西安链酷科技

卡牌游戏 农场链游

下载安装Ipa Guard

PPT制作软件哪个好?各种类型的10款好用PPT软件盘点!

彭宏豪95

效率 PPT PPT模板 办公软件 效率办公

沐浴阳光,贴心陪伴,全屋智能大模型应用论坛即将发布小度全屋智能新产品

新消费日报

Java和Python对比,看完这篇你就知道有什么不同了

树上有只程序猿

Python java

DAPP智能合约质押借贷挖矿理财系统开发案例详情 系统成品模板出售

西安链酷科技

DAPP系统开发 质押挖矿系统开发

文心一言 VS 讯飞星火 VS chatgpt (112)-- 算法导论10.2 3题

福大大架构师每日一题

福大大架构师每日一题

西安软件开发公司技术团队

西安链酷科技

软件开发 DAPP智能合约交易系统开发 区块链项目开发

秒合约交易系统技术开发/源代码/合约跟单

V\TG【ch3nguang】

金句频出!天翼云中国行·赣州站,大咖有话说!

天翼云开发者社区

云计算

如何更优雅的编程?面向接口编程四大法宝!

这我可不懂

函数式编程

英特尔宣布Intel 4已大规模量产,“四年五个制程节点”计划又进一步

E科讯

业财融合潮流下,构建国有企业全面预算管理体系

智达方通

业财融合 全面预算管理

智慧公厕厂家为城市智慧化建设提供城市卫生升级的力量

光明源智慧厕所

智慧厕所 智慧公厕 厕所改造 公厕改造

与领航者共话湖仓, StarRocks Summit 2023 技术专场分论坛剧透来了!

StarRocks

StarRocks 湖仓 新范式

GraphQL 查询使用指南:语法示例和最佳实践

Apifox

最佳实践 前端 后端 API graphql

PostgreSQL 16正式发布 HashData贡献中国智慧

酷克数据HashData

张雷博士谈IBM沃森背后的AI技术_Java_徐涵_InfoQ精选文章