AutoInt算法解读-InfoQ

AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks

现在已经有很多深度学习推荐算法旨在构造高阶交叉特征上，比如 WDL，DeepFM，Deep cross network，xDeepFM 等模型。但是这些方法有一些缺陷：fully-connected neural networks 抽取的高阶特征在学习 multiplicative feature interactions 上是 inefficient 的；并且隐式学习特征交叉的方式也缺乏可解释性。因此本文通过 Multi-head Self-Attention 机制显示构造高阶特征，有效提升了 CTR 预估的准确率。

论文的贡献在于：

提出显示学习高维特征交叉的一种方法，并提高了可解释性。
基于self-attentive neural network提出一种新的方法，可自动学习高维特征交叉，有效提升了CTR预估的准确率。

模型结构

Input Layer：x = [x1; x2; …; xM]，其中M表示总共的feature fields的数目，xi表示第i个特征，如果xi是离散的，就是one-hot向量，如果是dense类型的特征，就是一个scalar。
Embedding Layer：
dense和cate类型的特征都经过embedding层，只不过cate特征的embedding是一个矩阵，而dense特征的embedding是一个向量。
Interacting Layer
每个嵌入向量[公式]分别对应三个转换矩阵：[公式]对于第 h 个 Attention head，当第 m 个嵌入向量[公式]作为query时，其对应输出[公式]为：
上式中，[公式]是可选的相似度计算函数，文中选择向量内积。

对第 m 个嵌入[公式]，拼接它在[公式]个 Attention head 的输出，然后引入标准的残差连接作为其最终输出[公式]：

Output Layer

其中[公式],[公式]表示 sigmoid 函数。

Training

损失函数：

总结

通过 Multi-head Self-Attention 机制显示构造高阶特征，并添加了 resnet 结构，又是一篇将 nlp 模型和图像领域中比较热门的模块用于推荐模型中的工作。

本文转载自 Alex-zhai 知乎账号。

原文链接：https://zhuanlan.zhihu.com/p/69701477

发布

暂无评论

区块链交易系统开发, 期货合约平台搭建
区块链交易系统开发,期货合约平台搭建
2020 年 9 月 15 日
第 58 讲｜基于分布式语义的知识表示与推理: 神经网络模型
无
2018 年 2 月 5 日
是时候要说再见了，春风十里，不如邮你！
"无财作力，少有斗智，既饶争时" --史学大家司马迁《史记·货殖列传》
2020 年 4 月 22 日
框架设计学习总结
以，直得己的发然味不道题现哪，到了师课才然悟原自一在面对的言行向程发从没用抽和口从没对己代进过计
2020 年 6 月 17 日
非线性降维：流形学习
在机器学习中，流形学习通常被视为非线性降维方法的代表。今天就和你分享几种典型的流形学习方法。
2018 年 7 月 5 日
解析 FaceNet 人脸识别模型
2019 年 3 月 7 日
40 丨数据挖掘实战（2）：信用卡诈骗分析
逻辑回归虽然不在我们讲解的十大经典数据挖掘算法里面，但也是常用的数据挖掘算法。
2019 年 3 月 15 日
基于深度学习的推荐模型之一：受限波兹曼机
这周，我们来讨论如何利用深度学习来提升推荐系统的精度。
2018 年 4 月 9 日
请描述什么是依赖倒置原则，为什么有时候依赖倒置原则又被称为好莱坞原则？
核心思想：依赖倒置核心思想是倒置依赖关系，高层依赖低层抽象（属于高层），低层实现低层抽象，低层抽象在概念上属于高层。高层决定低层，高层模块定义低层模块抽象接口，
2020 年 9 月 27 日
架构师训练营—Week11 学习总结
学习总结Week11
2020 年 8 月 26 日
Map 与工厂模式，在 Go 语言中实现 Set
2019 年 3 月 7 日
架构师训练营 Week2 作业
依赖倒置原则：上层模块不应该依赖底层模块，它们都应该依赖于抽象。比如在SPI实现，调用者属于高层，被调用则属于底层，按照一般逻辑，高层调用底层，需要底层先实现功能，比如实现一个函数接口，高层再调用这个接口；但这样的方式依赖性太强，高层必须依赖
2020 年 9 月 26 日
架构师训练营第一周作业 - 食堂就餐卡系统设计
架构师训练营第一周作业 - 食堂就餐卡系统设计
2020 年 6 月 10 日
一周信创舆情观察 (7.27~8.2)
一、一周舆情要点
2020 年 8 月 5 日
作业一：食堂就餐卡系统设计
系统中每个消费者都有一张卡，在管理中心注册缴费，卡内记着消费者的身份、余额。
2020 年 6 月 10 日