AICon 深圳站聚焦 Agent 技术、应用与生态,大咖分享实战干货 了解详情
写点什么

多任务学习在推荐算法中的应用(一)

  • 2020-01-07
  • 本文字数:1023 字

    阅读完需:约 3 分钟

多任务学习在推荐算法中的应用(一)


导读:我们在优化推荐效果的时候,很多时候不仅仅需要关注 CTR 指标,同时还需要优化例如 CVR ( 转化率 )、视频播放时长、用户停留时长、用户翻页深度、关注率、点赞率这些指标。那么一种做法是对每个任务单独使用一个模型来优化,但是这样做的缺点显而易见,需要花费很多人力。其实很多任务之间都是存在关联性的,比如 CTR 和 CVR。那么能不能使用一个模型来同时优化两个或多个任务呢?其实这就是 Multi-task 多任务的定义。本文主要总结了近两年工业界关于 Multi-task 模型在推荐场景的一些应用和工作。

1. 阿里 ESMM

Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate


CVR 是指从点击到购买的转化,传统的 CVR 预估会存在两个问题:样本选择偏差和稀疏数据。



样本选择偏差是指模型用用户点击的样本来训练,但是预测却是用的整个样本空间。数据稀疏问题是指用户点击到购买的样本太少。因此阿里提出了 ESMM 模型来解决上述两个问题:主要借鉴多任务学习的思路,引入两个辅助的学习任务,分别用来拟合 pCTR 和 pCTCVR。



ESMM 模型由两个子网络组成,左边的子网络用来拟合 pCVR,右边的子网络用来拟合 pCTR,同时,两个子网络的输出相乘之后可以得到 pCTCVR。因此,该网络结构共有三个子任务,分别用于输出 pCTR、pCVR 和 pCTCVR。假设用 x 表示 feature ( 即 impression ),y 表示点击,z 表示转化,那么根据 pCTCVR = pCTR * pCVR,可以得到:



则 pCVR 的计算为:



由上面的式子可知,pCVR 可通过 pCTR 和 pCTCVR 推导出来,那么我们只需要关注 pCTR 和 pCTCVR 两个任务即可,并且 pCTR 和 pCTCVR 都可以从整个样本空间进行训练?为什么呢,因为对于 pCTR 来说可将有点击行为的曝光事件作为正样本,没有点击行为的曝光事件作为负样本,对于 PCTCVR 来说,将同时有点击行为和购买行为的曝光事件作为正样本,其他作为负样本。模型的 loss 函数:



另外两个子网络的 embedding 层是共享的,由于 CTR 任务的训练样本量要远超过 CVR 任务的训练样本量,ESMM 模型中 embedding 层共享的机制能够使得 CVR 子任务也能够从只有展现没有点击的样本中学习,从而能够极缓解训练数据稀疏性问题。


本文转载自 DataFunTalk 公众号。


**原文链接:https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247496333&idx=1&sn=da03f8db68e5276cffe73e090ac271ec&chksm=fbd740e1cca0c9f76da90a713311bac81e9890c1f9fd69976705e167dd30e4135db6ea297d6b&scene=27#wechat_redirect


2020-01-07 09:491228

评论

发布
暂无评论
发现更多内容

一篇读懂Volatile关键字

是月月啊2023

Java 面试题

如何将自己的项目打包成whl文件分享

IT蜗壳-Tango

谷歌史上最强大模型Gemini抢鲜知!!!

江湖修行

AI Google openai #人工智能 #大模型

OpenTiny Vue 3.12.0 发布:文档大优化!增加水印和二维码两个新组件🎈

Kagol

极狐GitLab 和 ArgoCD 集成实现 GitOps

极狐GitLab

DevOps gitlab CD workflow ArgoCD

低代码实现探索(六十一)字段隔离解耦

零道云-混合式低代码平台

17 | 跳表:为什么Redis一定要用跳表来实现有序集合

鲁米

app开发

Geek_8da502

喜报!乘云数字获浙江省“专精特新”企业认定

乘云数字DataBuff

华秋喜获“2023深圳行业领袖企业100强”称号

华秋电子

软件测试/人工智能|一文告诉你Python元组相关操作

霍格沃兹测试开发学社

英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

E科讯

技术人年度回顾:大模型驱动的变革与影响

熬夜磕代码、

大模型

【技术人的 2023】 ——我的AI学习之旅年度总结

YoLo

AI

2024营销日历新鲜出炉!提前规划,赢在起跑线!

彭宏豪95

互联网 营销 在线白板 活动策划 效率软件

写作训练营打卡2--工作后最有成就感的事

Avril

[译]你应该知道的多个HTML属性

南城FE

html html5 前端

系统分析师还是架构师?

escray

技术人写作 21 天技术人写作行动营

FFA 2023 明日开幕,Flink 智能诊断、小红书流批一体实践精彩来袭

小红书技术REDtech

大数据 flink 架构 流批一体

最全最详细的Java异常处理机制

是月月啊2023

Java 面试题

一起学Elasticsearch系列-模糊搜索

Java随想录

Java 大数据 elastic

写作行动营学员打卡-Day3-工作笔记

Luke

2023 总结对AI的总结和展望

查拉图斯特拉说

AI 大模型

ETL+BI结合的数据集成工具

RestCloud

BI ETL 数据集成

避坑指南之财务共享中心的服务管理

用友BIP

财务共享

聚首江城,共创开源未来 | 2023 OpenHarmony城市推介会•武汉市圆满落幕

科技热闻

PostgreSQL 技术内幕(十二)CloudberryDB并行化查询之路

酷克数据HashData

SQL CREATE INDEX 语句- 提高数据库检索效率的关键步骤

小万哥

MySQL 数据库 sql 程序员 后端开发

一款带键扫的LED驱动电路

芯动大师

全面高压化与全面超快充,破解新能源汽车的时代难题

脑极体

数字能源

鸿蒙原生应用开发——分布式数据对象

HarmonyOS开发者

HarmonyOS

多任务学习在推荐算法中的应用(一)_文化 & 方法_Alex-zhai_InfoQ精选文章