写点什么

基于时间加权的用户购买类目意愿计算

  • 2019-09-27
  • 本文字数:928 字

    阅读完需:约 3 分钟

基于时间加权的用户购买类目意愿计算

一、背景

在 DMP 的人群画像或者商品画像等的应用中,有一类常见的打分需求:旨在基于一些 transactions,为两种关系打上一个归一化的分数。比如基于一个用户的购买商品行为对该用户购买类目意愿打分,该文章讨论如何在考虑时间因素的情况下给用户打分。

二、要求

  • transaction 发生的时间越近,其所占的比重越大,且减小的速度越来越慢。

  • 所有分数都需要正则化到 0-100 区间。

三、数据形式

输入的数据(表示某人某天买了某个类目多少单):用户 id、日期、类目 id、订单数


最终产出数据:用户 id 对每个类目的购买意愿分


四、实现方式

1) 要求 transaction 发生时间和现在的距离越小,这条记录越大,就像一个热门事件,会被人慢慢遗忘,且后续遗忘的速度越来越慢。


基于这个需求,很容易让人想到基于热力学的牛顿冷却定律:物体的冷却速度,与当前温度与室温之间的温差成正比。


换成数学语言表达:



其中 H 为室温,初始时刻的温度为:



其中α>0 为与物体有关的常数,为负数表示当物体温度高于室温的时候,物体温度会下降,但当物体温度低于室温的时候会上升。


对于上个公式,两边取积分:




eg: 人体在死亡后,温度调节功能随即消失,由此正常温度(假设 37)与室温比较,利用牛顿冷却定律可以获得死亡时间。


假设某冬天早上,接到报警,街头发现流浪汉尸体,6:30AM 测量其体温为 18 度,到了 7:30AM,其体温已经下降为 16 度。



预备知识完了,现在我们回到业务:假设 transaction 发生当天的热度为 100 度


而 180 天之前的 transaction 我们假设降为 1 度,又假设室温为 0 度,可以求出α:



2) 对分数(上面的 sum_score)做归一化。


假设对于 sum_score,有最大值和最小值,如果差距过于大,会先对其做对数处理:



图像为:



该函数以原点为中心,将实数集映射到值(0,1)且两边都是开区间。我们希望通过平移和拉伸,对于上面的 [ -15,2 ] 的区间映射做映射:



符合要求,然后 0-1 的分数再乘以 100,将其转成 0-100 的归一分数。


本文转载自公众号有赞 coder(ID:youzan_coder)


原文链接


https://mp.weixin.qq.com/s?__biz=MzAxOTY5MDMxNA==&mid=2455760033&idx=1&sn=cda32ddd58fea2a18e2d4ec9cb88f86b&chksm=8c686a84bb1fe39246da325ff19d7fdb66c947ee2ec061daf86e1f203d3e15f09eb3396e16f1&scene=27#wechat_redirect


2019-09-27 08:001491

评论

发布
暂无评论
发现更多内容

ONES 重磅升级|全新内核,深度可配置,适配复杂业务流

万事ONES

项目管理 研发管理 ONES 全新升级

零刻发起NAS用户共创活动,征集创新理念共塑未来产品形态

财见

干货推荐:分钟级定位 IO 瓶颈,多租户云环境下的智能诊断

OpenAnolis小助手

阿里云操作系统控制台

第五届 RTE 年度 Demo Day 三强公布!看到对话式 AI 的 N 种未来

RTE开发者社区

Meta AI 推出全语种语音识别系统,支持 1600+语言;谢赛宁、李飞飞、LeCun 联手发布「空间超感知」AI 框架丨日报

RTE开发者社区

沙特阿拉伯将于11月主办第11届最不发达国家问题部长级会议

财见

转转客服IM聊天系统背后的技术挑战和实践分享

JackJiang

websocket 即时通讯 im开发 Web端即时通讯

进入职场第四课—产出

老李说技术

职场 职场发展

一场论坛捕捉 26 年语音 AI 关键词:思考机制、专有模型、低功耗、超低帧率、多语种、语音增强……丨RTE2025 回顾

RTE开发者社区

工业设计 自控设计经验总结(18)

万里无云万里天

设计师 工业 工厂运维

工业管理 项目管理经验总结(30)

万里无云万里天

项目管理 工业 工厂运维

赋能华中企业数智转型破局前行:「AI共创 三生万物」司马阅2025企业AI落地应用峰会武汉站圆满落幕

司马阅

企业智能体中台落地指南:蓝凌 LanBots.AI 赋能新质生产力实践

极客天地

Inspira在PEAK Matrix®评估中获评领导者

财见

软硬协同!RISC-V 生态分论坛精彩议程公布 | 2025 龙蜥大会

OpenAnolis小助手

龙蜥操作系统大会

分钟级定位 IO 瓶颈:多租户云环境下的智能诊断

阿里云基础软件

阿里云 操作系统控制台 IO异常

DotNetGuide突破了 9.5K + Star,一份全面的C#/.NET/.NET Core学习、工作、面试指南知识库!

追逐时光者

C# .net 微软

RPA这么多,到底该选谁?2026 企业自动化选型全攻略

Techinsight

纳斯达克上市公司Pinnacle Food宣布新战略计划,旨在扩展其智慧农业创新平台

财见

干货推荐:看阿里云操作系统控制台如何一招擒拿网络丢包

OpenAnolis小助手

技术干货 阿里云操作系统控制台

干货推荐:OOM 杀进程 or 应用卡顿?该如何抉择

OpenAnolis小助手

操作系统 阿里云操作系统控制台

Weblate审计日志IP泄露漏洞分析

qife122

网络安全 Weblate

Rathbones呼吁紧急增加区域投资以推动英国增长

财见

TÜV莱茵为开立威尔逊多款消化内科手术器械颁发MDR公告机构证书

财见

从同步耦合到异步解耦:消息中间件如何重塑系统间的通信范式?

poemyang

消息中间件 高并发架构

宝尊将于2025年11月25日发布2025年三季度未经审计财务业绩

财见

收藏!2025 龙蜥操作系统大会闯关攻略来啦

OpenAnolis小助手

龙蜥操作系统大会

别再把DevOps当工具!90%企业都在做假DevOps,文化才是根本,很多团队都搞反了!

六边形架构

DevOps CI/CD 团队文化 自动化运维

RedisTemplate和StringRedisTemplate的区别及个人见解

刘大猫

人工智能 云计算 算法 物联网 大模型

Intigriti Bug Bytes

qife122

网络安全 漏洞挖掘

基于时间加权的用户购买类目意愿计算_文化 & 方法_Jason_InfoQ精选文章