【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

专访 DLP-KDD 最佳论文作者,探讨图神经网络的特点、发展与应用

  • 2020-04-28
  • 本文字数:2872 字

    阅读完需:约 9 分钟

专访DLP-KDD最佳论文作者,探讨图神经网络的特点、发展与应用

InfoQ 的读者大家好,我是 KDD Workshop DLP-KDD 2020 的联合主席王喆,在 DLP-KDD 2020 征稿之际,我们专访了上一届 Workshop Best Paper Award(An End-to-End Neighborhood-based Interaction Model for Knowledge-enhanced Recommendation)的获得者:曲彦儒,白婷,与这两位图神经网络领域的专家深入探讨当前的学术及工程热点“图神经网络”的发展和应用,希望对大家有所帮助和启发。



Q : 能否简要介绍一下图神经网络与传统的神经网络(比如经典的 Embedding+MLP 结构,以及 RNN 等序列模型)之间的联系和区别?


A : 这些模型的共同点在于, 都是通过神经网络端到端地拟合输入数据和输出数据之间的函数关系。他们之间最主要的区别在于, 不同的模型结构能够适应不同的先验知识. 比如全连通神经网络,没有假设任何先验知识, RNN 能够适应线性和序列性先验, 图神经网络能够适应更加复杂的结构性先验, 比如定义多个概念之间的关系, 描述复杂的非线性结构等。


此外,相比于其他神经网络模型,图神经网络能够从结构和功能两个方面建模数据整体特性,结构是指已有数据本身的相互关联,是已观测到的;功能是指信息在图中传播、相互影响的过程,与已有结构有关,也与具体应用场景有关。因此,与其他神经网络模型相比,图神经网络在数据建模和信息挖掘上,具有更强的普适性。


Q : 如何看待图神经网络在当前学术界的热度和发展?


A : 图神经网络是当前研究的一个热点,从历史上看,这是一个很自然的事情。事物存在即产生关联,网络无处不在。图作为描述网络的数学语言,能够很好的刻画万象的物理世界。关于图的研究,最早可以追溯到 18 世纪,在 20 世纪已经是一个很重要且热门的研究点。近年来,随着深度学习的兴起,神经网络表现出强大的数据拟合和刻画能力。图 + 神经网络,可以说是强强联合,作为一种适用场景广泛,且数据拟合能力强的建模方式,受到学术界的广泛关注是非常自然的事情。


具体来讲,从数据的角度来看,相比于图像和文本, 图类型数据的分布更加广泛, 图结构也是更加复杂且一般的数据结构。图神经网络是处理图类型数据的一个通用端到端模型。从原理上来看, 图神经网络也能够更好地适应一些问题, 比如推理。图神经网络拓展了机器学习模型的活动范围, 使得我们能够高效处理新的数据和问题, 因此近年来取得了较好的发展。目前,图神经网络也存在一些普遍问题, 比如如何提升在大规模图上的效率, 如何降低采样方法带来的方差等。


Q : 图神经网络和之前的 DeepWalk,Node2vec 等 Graph Embedding 方法有什么不同?


A : 基于 Random Walk 的 Graph embedding 方法本质上没有直接处理图结构, 而是通过将节点和邻域序列化, 转化为类似于文本的线性结构。图神经网络的优势在于能够直接处理图结构, 同时进行节点和邻域之间的信息传播以及参数更新。两种方法在不同数据上表现各有优劣, 整体看来图神经网络更加端到端, 更加通用。另外,关于 Graph Embedding 的定义和范畴,不同的人有不同的理解,我个人认为图神经网络可以看作是深层的 Graph embedding,因为不管是使用卷积、注意力等各种不同方式,最终也是得到带有结构信息的节点低维特征表示。


Q : 什么样的数据更适合图神经网络处理?数据的结构特点对最终效果的影响大吗?


A : 之前说到图神经网络的适用性非常强,即与其他神经网络模型相比,在大部分的应用场景下,效果不会太差,而且更加鲁棒。但针对具体的问题,是否选择图神经网络来处理,我觉得主要看应用场景和数据特点。举个例子,如果数据中序列性非常强,或者要研究的问题跟时间强相关,我个人觉得直接采用序列模型建模更加合适;如果数据比较稀疏,需要邻域节点做信息协同建模,那基于空间的图神经网络就很适合。总之,观察数据特点,分析研究的问题,图神经网络模型也需要根据数据特点来定制。图神经网络可以看作万金油,但不是特效药。


Q : 文章提出了 NI Model(Neighborhood Interaction Model),是否能够处理高阶关系(>2)数据?高阶数据对最终的效果是否有价值?


A : 我们提出的 NI 模型是将知识图谱引入推荐,通过分别聚合用户和商品的高阶邻域信息,建模融合邻居信息的交互。NI 模型可以处理高阶的关系,但从实验效果上,跟已有图神经网络的研究一致,2-3 阶的图神经网络已经能够达到最优的效果了,阶数太低,聚合信息可能不足,阶数太高,又可能会引入噪声数据。在图神经网络中,聚合太高阶的关系,会导致计算开销太大,且很多时候会使效果变差。


Q : 图神经网络有哪些应用领域和应用场景?


A : 图神经网络的应用领域广泛,图作为刻画网络的数学语言,个人认为是可以延续网络科学应用的各个领域,如: 经济网络、通信网络、交通网络、社交网络、购买网络、生物网络等各个方面。目前研究比较多的应用场景还是在社交推荐等场景中,尤其是在关系预测、推荐系统、实体搜索、信息传播等方面。


Q : 图神经网络领域还有哪些待解决的热点问题?如果让你来选择 NI Model 工作的下一步方向,你会如何选择呢?


A : 我认为有以下几个方面,一是图神经网络的鲁棒性和效率问题,包括预训练图神经网络、 降低采样方法在大规模图上的方差、如何处理超大规模网络;二是图神经网络的动态性,当引入变化的网络结构时,如何保证模型的适应性和稳定性;三是图神经网络的异构性,当网络存在异构的边和节点信息、节点和边具有属性信息,如时序信息等,如何将多种异构的语义空间建模在同一个网络中;四是基于图神经网络的高阶推理,基于图逻辑推理是使图神经网络具备更强大智能的基础。这些都是目前图神经网络研究中需要进一步研究和探讨的问题。邻域交互模型 (NI model) 主要探究了推荐系统中用户邻域 (用户背景知识) 和商品邻域 (商品背景知识) 之间的交互关系, 事实上,基于背景知识的图结构和交互关系是非常普遍的。我们在实验中发现, 现有的图神经网络还不能很好地刻画邻域之间的交互, 这说明图神经网络本身还有提升的空间。我们希望能够从邻域交互模型出发, 进一步改进基础的图神经网络, 此外,也将进一步探讨在交互过程中,利用知识图谱的高阶推理带来推荐模型的性能的提升,在更广阔的应用场景中带来一些新的启发。


专家简介:


曲彦儒,上海交通大学本硕,UIUC 在读博士,在 WWW,AAAI,ICDM 等会议发表论文多篇,研究方向信息系统,知识图谱,自然语言处理。


白婷,中国人民大学博士,计算机学院讲师,在 SIGIR、WWW、KDD、CIKM、WSDM、NAACL、TKDE 等会议、期刊发表多篇文章,其中有三篇获得最佳论文 / 最佳论文候选奖。研究方向是推荐系统,深度学习,社交媒体数据挖掘和用户行为分析。


DLP-KDD Workshop 介绍:


DLP-KDD 作为数据挖掘、机器学习领域学术盛会 KDD 的下设 workshop,由阿里发起,这届 workshop 由来自阿里巴巴 / 腾讯 / 新浪微博 /Google(DeepMind)/Facebook/ 微软 /Roku,以及上海交通大学 / 犹他大学等工业界 / 学术界资深同行组成主席团,旨在促进深度学习在广告、推荐、搜索场景下的应用与业界交流,录用文章的工程性、实用性很强,推荐算法工程师同行和学术界的研究者们积极参与。


DLP-KDD 2020 的征稿结束日期是 2020 年 5 月 20 日,详细投稿信息请点击这里进行查看。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-04-28 14:001753

评论

发布
暂无评论
发现更多内容

圆圈正义 - 读后感

石云升

读书笔记 法律 公平 现实

Go: Trace包探秘

陈思敏捷

原理 Go 语言

《零基础学 Java》 FAQ 之 12-理解引用

臧萌

Java

我的编程之路 -5(停滞)

顿晓

网络编程 操作系统 编程之路 停滞 三年

游戏夜读 | 怎么让游戏跑起来?

game1night

python实现·十大排序算法之快速排序(Quick Sort)

南风以南

Python 排序算法 快速排序

看完这篇 Session、Cookie、Token,和面试官扯皮就没问题了

cxuan

https

Mysql增量更新-ON DUPLICATE KEY UPDATE

BerryMew

MySQL 增量更新 ON DUPLICATE KEY UPDATE

工作=投资=创业?

二鱼先生

个人成长 工作思路 工作方式 创业心态 创业者

2020 年 5 月 23 日 Java 集合专题

瑞克与莫迪

Java

利与弊-传统框架要不要部署在Serverless架构上

刘宇

Serverless Web

云直播平台的选型与使用

音视频专家-李超

RocketMQ - 什么是RocketMQ

Java收录阁

RocketMQ

JUC整理笔记一之细说Unsafe

JFound

Java

prometheus中honor_labels配置项的源码分析

陈思敏捷

Prometheus Go 语言

Go: g0, 特殊的goroutine

陈思敏捷

原理 Go 语言

python实现·十大排序算法之插入排序(Insertion Sort)

南风以南

Python 排序算法 插入排序

我是如何拿下PMP认证和系统架构设计师考试的?

Nick

《零基础学 Java》 FAQ 之 10-Scanner里nextInt的小坑

臧萌

Java

new() 和 make的区别

陈思敏捷

源码 源码分析 Go 语言

《零基础学 Java》 FAQ 之 11-为什么构造方法中调用重载的构造方法必须得是在第一行

臧萌

Java环境搭建

编号94530

Java java8 Java环境 环境安装 jdk安装

除了直接看余额,谁更有钱还能怎么比(一)

石君

零知识证明 多方计算 同态加密

Tekton 的工作原理

张晓辉

Kubernetes cicd 云原生

谈谈控制感(8):元控制感

史方远

职场 心理 成长

Flask-SQLAlchemy 多表对单模型

Leetao

Python flask 编程语言 flask-sqlalchemy

区块链2.0--以太坊概述

皮卡丘的猫

Go: 应该使用指针还是结构体副本?

陈思敏捷

struct 原理 pointer Go 语言

k8s上运行我们的springboot服务之——cloud gateway

柠檬

k8s Spring Cloud

你是个伪工作者么?

池建强

个人成长 伪工作者

其实你就是我羡慕的别人

小天同学

个人成长 感悟 日常思考

专访DLP-KDD最佳论文作者,探讨图神经网络的特点、发展与应用_AI&大模型_王喆_InfoQ精选文章