上海架构师集结!4月25-26日,全球架构师峰会首次落地上海,吴翰清、汪源、叶绍志等大咖确认出席 了解详情
写点什么

FGCNN 模型解读

2019 年 12 月 02 日

FGCNN模型解读

ABSTRACT

在一些深度学习推荐模型中,增加 artificial 的 features 通常会提升效果,比如 Wide & Deep 的 wide 测,但是人工设计特征代价很高。因此需要一种自动提取有效特征,丰富特征表示的方式。该工作提出了 Feature Generation by Convolutional Neural Network (FGCNN)模型解决该问题。FGCNN 有两个模块: Feature Generation 和 Deep Classifier。其中 Feature Generation 利用 CNN 去生成 local patterns 并且组合生成新的特征;Deep Classifier 则采用 IPNN 的结构去学习增强特征空间中的交互。该工作表明 CTR 预测的一个新方向:通过外部的模型减少 DNN 部分学习高阶特征的难度,本文就是通过 CNN+MLP 学习的特征,添加到 DNN 部分。如图 1 所示:



INTRODUCTION

文中解释了为什么 DNN 学习有效的特征交互有时候是比较困难的,因为有效的特征交互都是比较稀疏的。例如:现在有 4 个特征 Name, Age, Height, Gender,来预测用户是否下载一个电子游戏,因为只有 Age 和 Gender 这两个特征对是否下载游戏有影响,这时候 DNN 必须学习到 Name and Height 的 embedding 表示都是 0 才可以,这对于 DNN 是很难的。


当然 CNN 其实是不适合 CTR 预测问题的,因为特征之间不像图像、文本那样存在局部相关性。比如(Name, Age, Height, Gender) or (Age, Name, Height, Gender)其实是没什么区别的。因此作者在模型左侧 Feature Generation 部分结合使用了 CNN 和 MLP,互相取长补短吧。


Model


模型结构:


  • Feature Embedding:其实在输入到 Feature Generation 和 Deep Classifier 之前有一个 embedding 层,用于将特征映射到低维的空间中,embedding 做法和之前的一些模型都一样,比如 multi-values 的 id 特征,各自的 embedding 求和等。

  • Feature Generation:是 CNN+Recombination 结构,CNN 提取 useful neighbor feature patterns,recombination layer(全连接层)基于 CNN 提取的特征生成 global feature interactions。CNN+Recombination 包括:Convolutional Layer, Pooling layer 和 Recombination layer。Feature Generation 生成的特征和 raw features 最后需要合并。

  • Deep Classifier:使用 IPNN 模型(这里其实可以使用各种 advanced network)。IPNN 模型如下图所示:

  • Objective Function:


EXPERIMENTS


上图表明,FGCNN 模型的效果比其他模型都要好。



上图表明,FFCNN 模型可以作为现有模型的一个很好的补充,并且效果提升很明显。


总结:

本文的创新之处在于,利用 CNN+MLP 提出一种模块 Feature Generation,用于提取 DNN 难 get 到的交叉 feature,然后将生成的 new_features 和 old_features 拼接在一起,输入到其他任何 classifier(可以是 FM、DNN、IPNN、DeepFM 等)中,都能提升效果。


参考文献:


https://arxiv.org/pdf/1904.04447.pdf


本文转载自 Alex-zhai 知乎账号。


原文链接:https://zhuanlan.zhihu.com/p/70087762


2019 年 12 月 02 日 16:22301

评论

发布
暂无评论
发现更多内容

Spring 5 中文解析数据存储篇-JDBC数据存储(上)

青年IT男

Spring5

训练营第二周作业1

Yangjing

极客大学架构师训练营

架构师训练营学习总结——第二周

文智

极客大学架构师训练营

回首挑灯看剑谱 - Week2 - 学习总结

小粽

第二周课后练习

jizhi7

架构师训练营,第二周总结

子文

极客大学架构师训练营第二周课后总结

jizhi7

SOLID原则

架构师训练营第 1 期 -- 第二周学习总结

发酵的死神

极客大学架构师训练营

第二周 框架设计作业

钟杰

极客大学架构师训练营

依赖倒置原则

知行合一

软件设计原则

软件设计的基本原则

天天向上

极客大学架构师训练营

架构师训练营第 2 周学习总结

netspecial

极客大学架构师训练营

荷之美 | 中国荷苑

xcbeyond

生活 摄影 摄影征文 荷花

架构师训练营第 1 期 -- 第二周作业

发酵的死神

极客大学架构师训练营

week1--作业一

hero_genlot

极客大学架构师训练营

第二周总结

Geek_ac4080

Mac mini 2020上手体验

墨凡

Mac

架构一期第二周作业

Airs

举办线下活动现场管理需要注意哪些事项?

boshi

管理 探索与实践 活动专区

Serverless 简介

木易杨

云计算 Serverless AWS

架构一期 - 甘霖 - Week2 - 作业一

小粽

架构师训练营第二周作业

听夜雨

极客大学架构师训练营

架构师训练营第二周学习感悟

听夜雨

极客大学架构师训练营

架构师训练营第二周课程笔记及心得

Airs

架构师01期,第二周课后作业

子文

架构师训练营第二周学习总结

成长者

极客大学架构师训练营

架构师训练营 Week2 总结

lggl

总结 极客大学架构师训练营

食堂就餐卡系统设计-作业

Kenny

作业

开源推荐:国内3大主流前端UI表单设计器,千万不要让领导知道

互联网应用架构

Vue Element antd

架构师训练营第 1 期 - 第二周学习总结

Anyou Liu

极客大学架构师训练营

OCR技术的未来发展与演进

OCR技术的未来发展与演进

FGCNN模型解读-InfoQ