写点什么

五大人工智能顶会 2019 必读的深度推荐系统相关的论文

  • 2019-08-23
  • 本文字数:2362 字

    阅读完需:约 8 分钟

五大人工智能顶会2019必读的深度推荐系统相关的论文

本文来自“深度推荐系统”专栏,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文主要总结一下深度推荐系统相关的几大顶会(包含 ICML2019/ KDD2019/ IJCAI2019/ WWW2019)必读的几篇论文,各位老铁学不动也得学,请收好。

强化学习

1. Generative Adversarial User Model for Reinforcement Learning Based Recommendation System, ICML 2019


作者:Xinshi Chen、Shuang Li、Hui Li、Shaohua Jiang、Yuan Qi、Le Song


论文解读


在蚂蚁金服被 ICML 2019 接收的这篇论文中,作者们提出用生成对抗用户模型作为强化学习的模拟环境,先在此模拟环境中进行线下训练,再根据线上用户反馈进行即时策略更新,以此大大减少线上训练样本需求。此外,作者提出以集合(set)为单位而非单个物品(item)为单位进行推荐,并利用 Cascading-DQN 的神经网络结构解决组合推荐策略搜索空间过大的问题[1]。

深度 CTR 预估

说到深度 CTR 预估的模型,就得祭出网上广为流传的这张图。今年到现在为止,下图深度 CTR 预估的图谱(深度 CTR 预估图谱来源于王喆老师的《谷歌、阿里等 10 大深度学习 CTR 模型最全演化图谱》一文)左边 DIN 家族系列进行了进一步的丰富。学不动也得学,老铁。



2. Deep Session Interest Network for Click-Through Rate Prediction, IJCAI 2019


作者:Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang


论文代码


阿里 at IJCAI 2019,考虑到不同用户行为序列的 session 内行为同构与 session 之间行为异构的特性提出了基于 sesssion 的 CTR 预估模型 DSIN。使用 self-attention 机制抽取 session 内用户兴趣,使用 Bi-LSTM 针对用户跨 session 兴趣进行建模。


3. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction, KDD 2019


作者:Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, Kun Gai


论文


阿里 at KDD2019,通过引入 UIC 存储单元与 MIMN 模型联合设计,解决用户超长行为历史下 CTR 预估建模与在线预测性能瓶颈,效果好于 GRU4Rec 和 DIEN。


4. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba


作者:Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, Wenwu Ou


论文解读


阿里巴巴搜索推荐事业部的新研究,首次使用强大的 Transformer 模型捕获用户行为序列的序列信号,供电子商务场景的推荐系统使用。原有 DIN 提出使用注意力机制来捕获候选项与用户先前点击商品之间的相似性,但未考虑用户行为序列背后的序列性质。离线实验和在线 A/B 测试表明,BST 与现有方法相比有明显优势。目前 BST 已经部署在淘宝推荐的 rank 阶段,每天为数亿消费者提供推荐服务[2]。


5. BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer


作者:Fei Sun, Jun Liu, Jian Wu, Changhua Pei, Xiao Lin, Wenwu Ou, Peng Jiang


论文


Transformer 引入推荐系统工业界,应用于利用用户历史点击序列预测下一个点击 item,效果超过 GRU4Rec。


6. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems


作者:Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, Kun Gai


论文TDM论文


还记得阿里 at KDD 2018 的深度树匹配召回模型 TDM 吗?升级版 JTM 提出索引与模型同时优化的方案,大幅提升召回效果。

Graph Embedding

7. NetSMF: Large-Scale Network Embedding as Sparse Matrix Factorization, WWW 2019


作者:Jiezhong Qiu, Yuxiao Dong, Hao Ma, Jian Li, Chi Wang, Kuansan Wang, Jie Tang


论文代码


提出适用于大规模网络表示学习方法 NetSMF,利用稀疏矩阵分解来学习大规模网络 embedding,相对于现有方法 DeepWalk/ LINE/ Node2Vec 等极大地提高了学习效率,并开源了代码。


8. Representation Learning for Attributed Multiplex Heterogeneous Network, KDD 2019


作者:Yukuo Cen, Xu Zou, Jianwei Zhang, Hongxia Yang, Jingren Zhou, Jie Tang


论文代码解读


传统的网络(图)表示学习方法一般只针对同构的图,但是实际的图往往都是异构的。只包含异构节点的图的表示学习已经被广泛研究,例如 metapath2vec 提出了异构的 random walk 和 skip gram。而包含异构边的图的表示学习近来开始被大家所关注,比如 MNE 给每个点学习多种表示来处理异构边的情形。


这个算法目前在阿里电商场景下得到应用,阿里的数据由用户和商品构成的图就是异构的,不仅包含异构的节点(用户和商品),而且包含异构的边(用户和商品的多种交互行为,比如点击、购买等)。不仅如此,图中的节点还包含着丰富的属性。本文处理的就是这种包含异构节点和异构边的图的表示学习[3]。


9. ProNE: Fast and Scalable Network Representation Learning, IJCAI 2019


作者:Jie Zhang, Yuxiao Dong, Yan Wang, Jie Tang, Ming Ding


论文代码


ProNE 利用矩阵的稀疏性,本质上是用一个低通滤波对原矩阵进行滤波,大大提高了速度,可以得到 10-400 倍的加速比。


10. Large Scale Evolving Graphs with Burst Detection, IJCAI 2019


作者:Yifeng Zhao, Xiangwei Wang, Hongxia Yang, Le Song and Jie Tang


论文


动态网络的表示学习最近引起广泛关注,清华今年和阿里巴巴在 IJCAI 上提出一个叫做 BurstGraph 的模型,有意思的是主要通过 burst 的 detection 来你和动态网络,这和传统大家都希望拟合一个平滑的动态模型不同。

参考文献

[1] 强化学习用于推荐系统,蚂蚁金服提出生成对抗用户模型


[2] 谷歌、阿里等10大深度学习CTR模型最全演化图谱


[3] 阿里将 Transformer 用于淘宝电商推荐


[4] 阿里电商场景下的大规模异构网络表示学习


[5] 唐杰THU老师的微博


本文授权转载自知乎专栏“深度推荐系统”。原文链接:https://zhuanlan.zhihu.com/p/69050253


2019-08-23 08:0010398

评论

发布
暂无评论
发现更多内容

MatrixOne从入门到实践07——MO-Tester

MatrixOrigin

数据库 分布式 测试工具 MatrixOrigin MatrixOne

公共大数据集群中如何配置 YARN 的公平调度器和容量调度器

明哥的IT随笔

hadoop YARN

技术指南 | 如何集成Perforce版本控制系统Helix Core (P4V) 与敏捷规划工具Hansoft

龙智—DevSecOps解决方案

敏捷 版本管理

面试官:介绍一下 Redis 三种集群模式

程序员小毕

redis 程序员 后端 java面试 redis集群

千年荒漠变绿洲,看沙漠“卫士”携手昇腾AI植起绿色希望

华为云开发者联盟

人工智能 华为云 昇腾AI

String、StringBuffer、StringBuilder 有什么区别

共饮一杯无

Java string 11月月更

软件测试自动化“领导者”SmartBear举办首场中国线上研讨会:洞悉全球自动化测试走向,探讨降本增效之策

龙智—DevSecOps解决方案

自动化测试 API测试 UI测试 软件测试自动化

ITSM | 对话——从业务场景、中国市场策略角度解读Atlassian ITSM解决方案

龙智—DevSecOps解决方案

ITSM ITIL

信息论与编码:恒参信道特性

timerring

11月月更 信息论与编码

vivo大数据日志采集Agent设计实践

vivo互联网技术

大数据 数据采集 日志采集 agent

Python 项目工程化最佳实践指南

Andy

Python 项目管理 代码规范 代码风格

Baklib|知识库应用场景:制作员工培训手册

Baklib

团队管理 知识管理

Java中的StringBuilder类

共饮一杯无

Java StringBuilder 11月月更

FCOS论文复现:通用物体检测算法

华为云开发者联盟

人工智能 华为云 论文复现

无情!阿里技术专家手写《微服务架构笔记》,瞬间屠榜NO.1

程序知音

Java 微服务 java架构 后端技术

Java中的拆箱与装箱

共饮一杯无

Java 11月月更 装箱与拆箱

异常的基本概念和Java中的体系

共饮一杯无

Java 异常 11月月更

代码质量与安全 | 使用Incredibuild加速Klocwork静态代码分析

龙智—DevSecOps解决方案

代码静态分析 SAST工具 SAST 编译器 加速器 编程语言

深度 | 新兴软件研发范式崛起,云计算全面走向 Serverless 化

Serverless Devs

阿里云 Serverless

我与梅西粉丝们的世界杯观球日常

ZEGO即构

音视频开发

重构了一个服务的健康检查组件

Java永远的神

Java 程序员 面试 后端 架构师

探讨Morest在RESTful API测试的行业实践

华为云开发者联盟

开发 API测试 华为云

降本增效的背后,谈谈阿里云存储数据湖3.0

云布道师

数据湖 云存储 云栖大会

FastJSON2他来了,性能显著提升,还能再战十年

共饮一杯无

Java Fastjson 11月月更

互联网大厂必问面试合集,助你跳槽拿高薪--Java篇

钟奕礼

Java java面试 java编程 程序员java

2022中国区Cyber Monday限时优惠来袭,Linux基金会开源软件学园带来优惠

kk-OSC

k8s Linux基金会 CKA CKS

逻辑回归与评分卡-二元回归与多元回归:重要参数solver & multi_class & class_weight

烧灯续昼2002

Python 机器学习 算法 sklearn 11月月更

企业网络“卫生”实用指南(上)

SEAL安全

网络安全 企业安全

一种基于 Apache Hive 的元数据智能发现方案

移动云大数据

hive

MySQL数据库 group by 语句怎么优化?

Java全栈架构师

Java MySQL 数据库 程序员 后端

DNS中有哪些值得学习的优秀设计

小小怪下士

Java 程序员 DNS

五大人工智能顶会2019必读的深度推荐系统相关的论文_AI&大模型_深度传送门_InfoQ精选文章