写点什么

阿里提出联合预估算法 JUMP:点击率和停留时长预测效果最优

  • 2018-06-05
  • 本文字数:1453 字

    阅读完需:约 5 分钟

停留时长预估

对于停留时间的预估,我们借鉴了“生存分析”(Survival Analysis) 的思想,通过时间发生的时间去近似用户在一个内容上停留的时间;从概念上来说,停留时长被认为是“离开当前内容”这个事件的发生时间。如果我们记用户的停留时长的样本为 O,假设存在一个函数,将 O 映射到一个简单的分布 f 上:

这里 f 可能是一个高斯分布,伽马分布等。可以证明的是:

其中 F 表示累计概率分布(CDF),T 是对 O 的在线近似。那么有了上述公式后,我们就可以使用最大似然估计去预估样本的停留时间。我们分析了 RecSys15 数据及上的停留时间,原始分布如左下图,然而我们对停留时间取 log 后,得到了右下图。我们很高兴的发现在取 log 之后,停留时间是符合正态分布的。

于是我们取 g 为 log 函数,f 为正态分布函数,最终我们能得到似然函数:

学习建模

我们记一个用户的会话为一个行为序列:\(s_k=\{(i_j,\log \tau _j,\delta _j)\},j=1,2,\cdots ,k\)。其中 i 表示第 j 个点击的商品,\(\tau _j\) 表示停留时间,而\(\delta _j\) 是一个 bool 类型,表示是否是会话的最后一个商品(或者停留时间过长)。我们假设样本是从一个分布 P(S) 中采样出来,那么可以将分布分解为 2 项的积。

其中前一项表示点击率的似然,后一项表示停留时间的似然;\(s_{k-1}\) 表示会话中第 k 次点击前的行为。为了从会话的行为中抽取更多的有效信息,我们提出了一种三层 RNN 模型去编码。

Attention Layer: 我们设计注意力机制主要目的是去除会话中的噪音,保留真正有效的信息。表示 fast-slow 层的输出,a 对应 attention 的权重,对应的计算方法如下面公式:

Fast-Slow Layer: fast-slow 层提出了一种新奇的 RNN 网络。当我们处理第 j 个输入\((i_j,\log \tau _j,\delta _j)\) 的时候,会进入一个 F-S 处理单元,其中包括一个慢元子和一个快元子序列,慢元子会记忆更多长期的记忆,而快元子会更多的获取当前的信息。F-S 处理单元如下图所示:

Embedding Layer: 网络的最底层是一个 embedding 层,该层将一个二元组\((i_j,\log \tau _j)\) 映射到一个向量上,我们使用 batch-normalizing 对输入进行标准化:

实验

为了验证算法的性能,我们将 JUMP 算法对比了主流的基于会话的预估算法,验证在点击率预估和停留时长预估上的效果。对比的算法包括 GRU、IGRU、NARM、DTGRU,RMTP、ATRP、NSR,使用的数据集是 RecSys15、CIKM16 和 REDDIT。

点击率预估的结果如下表所示,我们可以看到在全部数据集上,JUMP 算法都能超越其他算法,取得最好的 Recall、MRR 和 NDCG 指标。

同时我们观察了 embedding 维度对 recall 指标的影响,结果如下图。我们可以到看随着 embedding 维度的提升,recall 指标都能得到一定的上升,但是基本都在 100 维左右达到最高;其次,我们仍然可以发现,JUMP 算法取得的效果是优于其他算法的,蓝色曲线总是在其他曲线之上。

除了点击率外,我们观察了在时间预估这个任务上的效果,结果如下表所示。对比 ATRP、RMTP 和 NSR 算法,JUMP 能明显提升预估的准度。

总结

本文提出了一种新奇的算法 JUMP,同时预估一个会话中的点击率和停留时间。主要有 3 点重要贡献:

  1. 使用生存分析的方法来建模用户的停留时间,建立在可靠的数据理论基础上;
  2. 提出了一种三层的 RNN 结构,基于注意力机制能提升模型的鲁棒性,降低噪音的影响;
  3. 使用了一种全新设计的 fast-slow 结构,加强对短会话的学习能力。大量实验验证了算法的有效性,在多个公开数据集上的结果,对比其他的算法都有大幅提升。

论文全文链接:

http://www.cs.zju.edu.cn/people/qianhui/pub/Zhou18.pdf

2018-06-05 17:5410486

评论

发布
暂无评论
发现更多内容

KWDB 开发站重磅上线!解锁 KWDB 开发资源宝库

KaiwuDB

数据库 KaiwuDB 分布式多模数据库 KWDB开源数据库

为何底层数据湖决定了 AI Agent 的上限?

字节跳动数据平台

启信慧眼AI驱动供应链风险决策,助力中国半导体企业安全出海

合合技术团队

人工智能 大数据 算法

联想ThinkStation PGX桌面AI超算工作站正式发售,AI开发迈入“掌机"时代

科技范儿

ChatBI如何重塑企业数据分析?2025年智能BI行业趋势解读

飞鲤

数据分析 BI BI 分析工具 ChatBI

【IEEE出版】第四届能源互联网及电力系统国际学术会议(ICEIPS 2025)

搞科研的小刘

能源互联网 国际学术会议 电力系统

低代码+AI 建表设计实操,无脑实现5分钟做一张表单

引迈信息

价格战拼到尽头,天润融通ZENAVA才是家电品牌的增长新引擎

天润融通

直播 QoE 监控体系设计与落地(二):流媒体卡顿优化实践

奔跑中的蜗牛666

android 音视频 卡顿

企业能源数字化转型的关键路径:MyEMS 的多系统集成方法论与接口标准化实践

开源能源管理系统

开源 能源管理系统

【AI算法RFID门禁选型指南】如何判断识别精准度与防串读能力?

斯科信息

斯科信息 AI算法RFID门禁 AI门禁 AI智能门禁

Dify vs. n8n:专才与通才的对决,为何AI应用开发首选Dify?

伊克罗德信息科技

最佳实践:基于Apache SeaTunnel从MySQL同步到PostgreSQL

白鲸开源

MySQL postgresql 大数据 开源 Apache SeaTunnel

在AI技术唾手可得的时代,挖掘直播工具新需求成为关键突破点

qife122

AI应用 直播工具

重磅来袭:2026智博会|世亚智博会|杭州智博会

AIOTE智博会

智博会 人工智能展 世亚智博会 杭州智博会

如何利用海外社交媒体监测工具提升品牌影响力?

沃观Wovision

跨境电商 社交媒体 沃观Wovision 舆情监测系统 海外舆情监测

连锁餐饮拓展微信业务:试错 3 个月,终于找到靠谱方案

微擎应用市场

区块链U卡APP的开发

北京木奇移动技术有限公司

区块链开发 软件外包公司 U卡APP

Dify 企业版 vs. 社区版:为规模化应用构建而生的企业级优势解析

伊克罗德信息科技

2025年第二季度移动网络威胁报告深度解析

qife122

移动安全

开源生态视角下 MyEMS 的能源管理系统国产化实践:架构设计与自主可控路径

开源能源管理系统

开源 开源能源管理系统

场地预约系统:数字化预约管理新生态,驱动场地运营高效协同

深圳亥时科技

为什么要做海外营销?

Wolink

海外社媒营销 海外营销推广 沃链Wolink 达人营销

利用Playwright MCP与LLM构建复杂的工作流与AI智能体

测试人

一篇教你读懂主流LLM平台:企业如何选择LLM平台

伊克罗德信息科技

天润融通客户联络,如何成为企业AI转型的“黄金切入口”?

天润融通

【IEEE出版】第四届云计算、大数据应用与软件工程国际学术会议 (CBASE 2025)

搞科研的小刘

云计算 大数据 软件工程

Dify企业版 vs. n8n企业版:企业数智化战略的核心抉择

伊克罗德信息科技

MyEMS 支撑公共建筑低碳运营:多维度能耗建模逻辑与运行优化策略

开源能源管理系统

开源 能源管理系统

从0到1掌握1688API:图片搜索获取技巧与避坑指南

tbapi

1688API 1688店铺数据采集 1688店铺所有商品API 1688整店商品采集

Dify 企业版 vs. 社区版:为规模化应用构建而生的企业级优势解析

伊克罗德信息科技

阿里提出联合预估算法JUMP:点击率和停留时长预测效果最优_阿里巴巴_周腾飞_InfoQ精选文章