东亚银行、岚图汽车带你解锁 AIGC 时代的数字化人才培养各赛道新模式! 了解详情
写点什么

卡内基梅隆大学 Ruslan Salakhutdinov 教授:要将领域知识结合到机器学习中

  • 2020-06-21
  • 本文字数:2196 字

    阅读完需:约 7 分钟

卡内基梅隆大学Ruslan Salakhutdinov教授:要将领域知识结合到机器学习中

6 月 21 日,由北京智源人工智能研究院主办的 2020 北京智源大会正式开幕(直播入口:https://2020.baai.ac.cn),大会为期四天,各主题论坛和分论坛将围绕如何构建多学科开放协同的创新体系、如何推进人工智能与经济社会发展深度融合、如何建立人工智能安全可控的治理体系、如何与各国携手开展重大共性挑战的研究与合作等一系列当下最受关注的问题进行交流和探讨。会上,卡内基梅隆大学教授 Ruslan Salakhutdinov 进行了主题为“Integrating Domain Knowledge into Deep Learning”的演讲,以下为 InfoQ 带来的内容整理。


首先,Ruslan Salakhutdinov 展示了近期所做的一系列研究,主要围绕深度学习带来的影响而展开,涉及的领域包括语音识别、计算机视觉、推荐系统、语言理解、药物发现 &医疗影像分析。



Ruslan 教授表示,当人们构建 AI 时通常倾向于从算法着手,因为开发计算机算法可以让计算机看到并感知人类身边的事物。如今,我们在机器学习和深度学习领域所面临的主要挑战有四方面,这四种挑战之间又是相互联系的,包括自然语言理解;具象化人工智能,深度强化学习和控制;如何将结构化的领域知识结合到模型中;多模型,半监督、自监督学习。



在进行监督学习训练时,我们将输入通过一些神经网络训练,最后产生输出内容。例如,当我们问到哪些冠状病毒会感染人群时,我们把从文本、表格或知识本体中得到的领域知识输入到模型中,然后就可能得到 MERS-CoV、SARS-CoV 或 Covid-19 这样的答案,因此领域知识对于模型十分重要。



同样地,我们可考虑构建一个知识库,目前很多公司已经构建了这样的知识库,这里蕴含了相关的领域知识,例如糖尿病可能引起病痛性神经病变,可以通过服用一些药物进行治疗,我们可以人工地建立一种内含各种关联的知识库,然后将这个知识库作为知识的来源,再把这些领域知识结合到模型中,最终得出答案,这个过程能够有效地将深度学习和知识库相结合。


但是,很多时候知识库并不是完整的,我们还需要从网络、文本和图谱中获得一些补充信息,而将这些信息结合在一起再进行训练可以很大程度上提高系统的性能。



另一个需要思考的问题是,当我们处理复杂的、多种情况并存的问题时,应该怎么办?仅使用深度学习模型和递归神经网络来解决这类问题是相当困难的。Ruslan 教授举了如下例子:


当问到“生产伏格列波糖片的公司总部在哪里”时,我们需要回答两个问题,首先是哪个公司生产伏格列波糖,一旦我们知道了这个问题的答案后,就可以问这家公司的总部在哪里。所以在这个案例中,当我们回答这家公司的总部在哪里时,首先要知道伏格列波糖片是武田药物公司的产品,该公司是日本最大的制药公司,然后就可以知道这家公司的总部位于日本大阪。这也就是我们提到的复杂的、多种情况并存的问题,当我们无法立即知道答案时,就需要将未知信息与从维基百科等不同渠道获取的信息相结合,才能最终回答出这个问题。


如今,面对这种复杂的问题,很多系统是回答不上来的,因为系统无法理解这种复杂的问题,甚至再遇到一个复杂的问题里面包含了 3 个提问时,回答问题的步骤和顺序又是怎样的,Ruslan 教授对此问题进行了讲解。


他认为,回答这种复杂问题,要首先注意回答问题的顺序,也就是优先级。但是优先问题不好归纳,而且归纳起来也会很慢,所以我们在思考能否利用深度学习模型来解决这一问题,将模型反向传播到架构上,以及我们能否更有效地实时回答这类问题。这时候利用领域知识来解决问题就是个非常理想的方式。他表示他的一名学生创立了这样一个可以实时回答复杂问题的系统,接下来,Ruslan 教授举了一个例子来进一步解释这个系统。



当我们问及,Steve Jobs 创办的公司哪家总部位于 Redwood City 时,这个模型就会实时地运行,它就是一台 CPU,能搜索出 500 万篇关于 Steve Jobs 创办的公司哪家总部位于 Redwood City 的文章,第一阶段需要检索出 Steve Jobs 创办了多少家公司,结果显示他创办了苹果和 next,但只有 next 才是正确答案,接下来模型就会给你一些信息,比如 next 公司的总部在哪,哪家公司总部位于 Redwood 市,你就可以实时地检索到这两条信息,然后将两条信息结合起来,可以得到正确的答案。


Ruslan 教授也对该系统如何做到这一点进行了解释。系统中非常关键的点是要做到一些能产生跟随关系的事情,我们给定一组实体,通常是一组特定的名词 X,然后找出其跟随关联 R,然后我们得到了一个答案,我们跟随另一个关联关系,得到了第二个答案,以此类推得到了一系列实体 Y,这里的 X 可以表示一种药品名称,而这里的跟随关联可能是生产商,基于这个就可以知道哪家公司生产了这种药品。



跟随关系可以给出一系列问题的答案,帮我们决定最终的正确答案是什么,这是非常理想地利用分析算法和利用归类法解决复杂问题的一种方式。


利用相关跟随关系方法能让我们根据一个实体建立起一个矩阵,这种方法的好处是可以双倍利用跟随关系创建很多矩阵,也就是相当于创建出了一个极为复杂的矩阵。之所以认为这种方式是高效的,是因为它可以在无需人工干预的情况下自动创建知识库。



最后,Ruslan 教授展示了通过该方法回答复杂问题最后得到的结果,结果表明,通过这种模式比传统的现有模型效果要好很多,而回答阶段性问题的速度也要比图神经网络快很多。



该模型在回答第一阶段问题时能在每秒钟处理 19 个问题,而在回答第三阶段每秒能处理 12-13 个问题。



更多智源大会相关演讲内容欢迎访问:


https://www.infoq.cn/event/?id=138


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2020-06-21 15:312960

评论

发布
暂无评论
发现更多内容

线上SQL超时场景分析-MySQL超时之间隙锁

快乐非自愿限量之名

MySQL 数据库 sql

云桌面解决方案在教育领域中的应用

青椒云云电脑

云桌面 云桌面解决方案

思考-RBAC中对于权限编码部分的压缩处理

alexgaoyh

Java rbac 权限设计 压缩算法 权限编码

【深入浅出JVM原理及调优】「搭建理论知识框架」全方位带你认识和了解JMM并发模型的基本原理

洛神灬殇

Java JVM 计算机 Java虚拟机 2024年第十六篇文章

Java语言之float、double内存存储方式

百度搜索:蓝易云

Java Linux 云服务器 float double

AI数字人系统源码无限制作数字人模型!

青否数字人

数字人

青否互动式数字人的亮点!

青否数字人

数字人

K8S学习指南(7)-k8s核心概念Annotation

俞兆鹏

代码之外:工程师的成长进阶秘籍

声网

《Java实战(第2版)》PDF

程序员李木子

私有云部署有哪些特征?企业该如何正确上云

青椒云云电脑

云桌面 云电脑 云电脑平台

微服务及其发展趋势

蝉翼2u

微服务 云原生 服务网格

《Java并发实现原理:JDK源码剖析》PDF

程序员李木子

POKT Network (POKT) :进军百亿美元市场规模的人工智能推理市场

股市老人

K8S学习指南(6)-k8s核心概念label和label selector

俞兆鹏

图文共赏---人工智能时代的由文生图

fliter

央国企数字化转型的“压舱石”与“新方略”

优秀

数字化转型 中央企业 国资委中央企业 央国企数字化转型

K8S学习指南(5)-k8s核心对象namespace

俞兆鹏

Kubernetes

青否数字人源码的四个端口!

青否数字人

数字人

Nginx【Nginx核心指令(rewrite指令、实战rewrite 、if指令、set和break指令】

百度搜索:蓝易云

nginx 云计算 运维 Web 云服务器

C# 字符串操作指南:长度、连接、插值、特殊字符和实用方法

小万哥

C# 程序人生 编程语言 软件工程 后端开发

5分钟教会你如何在生产环境debug代码

EquatorCoco

前端 bug 生产环境 review

KubeBlocks 参展首届 PolarDB 开发者大会,双方发布深度合作

小猿姐

数据库 云计算 polarDB 阿里云PolarDB

【第七在线】利用大数据与AI,智能商品计划的未来已来

第七在线

中国首个车路云一体化研究中心成立,将如何改变自动驾驶?

自象限

自动驾驶

解密最受欢迎的开源 Serverless 框架:流量篇

阿里巴巴云原生

阿里云 云原生

什么是 Redis?它的特点是什么?Redis的数据类型有哪些?Redis的主要应用场景有哪些?

百度搜索:蓝易云

redis 云计算 Linux 运维 云服务器

【深度观点】资源数字化、数字资产化与资产数权化是分布式商业运行的核心要素

Geek_e4ef21

数字化转型 数字资产 数据要素 分布式商业

《2023中国低代码商业落地研究报告》

EquatorCoco

低代码 行业报告

贯通用友T+与企企,引领企业数字化转型新篇章!

聚道云软件连接器

案例分享

移动图形工作站有哪些价格实惠的推荐?

青椒云云电脑

图形工作站 移动图形工作站

卡内基梅隆大学Ruslan Salakhutdinov教授:要将领域知识结合到机器学习中_AI&大模型_李冬梅_InfoQ精选文章