AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

基于时间加权的用户购买类目意愿计算

  • 2019-09-27
  • 本文字数:928 字

    阅读完需:约 3 分钟

基于时间加权的用户购买类目意愿计算

一、背景

在 DMP 的人群画像或者商品画像等的应用中,有一类常见的打分需求:旨在基于一些 transactions,为两种关系打上一个归一化的分数。比如基于一个用户的购买商品行为对该用户购买类目意愿打分,该文章讨论如何在考虑时间因素的情况下给用户打分。

二、要求

  • transaction 发生的时间越近,其所占的比重越大,且减小的速度越来越慢。

  • 所有分数都需要正则化到 0-100 区间。

三、数据形式

输入的数据(表示某人某天买了某个类目多少单):用户 id、日期、类目 id、订单数


最终产出数据:用户 id 对每个类目的购买意愿分


四、实现方式

1) 要求 transaction 发生时间和现在的距离越小,这条记录越大,就像一个热门事件,会被人慢慢遗忘,且后续遗忘的速度越来越慢。


基于这个需求,很容易让人想到基于热力学的牛顿冷却定律:物体的冷却速度,与当前温度与室温之间的温差成正比。


换成数学语言表达:



其中 H 为室温,初始时刻的温度为:



其中α>0 为与物体有关的常数,为负数表示当物体温度高于室温的时候,物体温度会下降,但当物体温度低于室温的时候会上升。


对于上个公式,两边取积分:




eg: 人体在死亡后,温度调节功能随即消失,由此正常温度(假设 37)与室温比较,利用牛顿冷却定律可以获得死亡时间。


假设某冬天早上,接到报警,街头发现流浪汉尸体,6:30AM 测量其体温为 18 度,到了 7:30AM,其体温已经下降为 16 度。



预备知识完了,现在我们回到业务:假设 transaction 发生当天的热度为 100 度


而 180 天之前的 transaction 我们假设降为 1 度,又假设室温为 0 度,可以求出α:



2) 对分数(上面的 sum_score)做归一化。


假设对于 sum_score,有最大值和最小值,如果差距过于大,会先对其做对数处理:



图像为:



该函数以原点为中心,将实数集映射到值(0,1)且两边都是开区间。我们希望通过平移和拉伸,对于上面的 [ -15,2 ] 的区间映射做映射:



符合要求,然后 0-1 的分数再乘以 100,将其转成 0-100 的归一分数。


本文转载自公众号有赞 coder(ID:youzan_coder)


原文链接


https://mp.weixin.qq.com/s?__biz=MzAxOTY5MDMxNA==&mid=2455760033&idx=1&sn=cda32ddd58fea2a18e2d4ec9cb88f86b&chksm=8c686a84bb1fe39246da325ff19d7fdb66c947ee2ec061daf86e1f203d3e15f09eb3396e16f1&scene=27#wechat_redirect


2019-09-27 08:001367

评论

发布
暂无评论
发现更多内容

☕️【Java技术之旅】带你看透Lambda表达式的本质

码界西柚

Java Lambda java8 Lambda函数 5月日更

Flink消费Kafka

大数据技术指南

大数据 flink 5月日更

架构实战营模块四总结

竹林七贤

从基础到实战一应俱全,这份全网首发的Kafka技术手册,超详细!

Java架构师迁哥

用ABAP 生成二维码 QR Code

汪子熙

二维码 SAP abap

CRM Transaction处理中的权限控制

汪子熙

CRM SAP abap

基于Agora Web SDK自定义直播画面

dajyaretakuya

WebRTC 声网 Agora 数字合成

全链路压测二十问干货汇总(上)

TakinTalks稳定性社区

打破思维定式(十一)

Changing Lin

ElasticSearch架构剖析

五分钟学大数据

大数据 elasticsearch 5月日更

图说丨一图看懂浪潮云“1231”业务战略

业界率先支持 MCP-OVER-XDS 协议,Nacos 2.0.1 + 1.4.2 Release 正式发布

阿里巴巴云原生

容器 微服务 云原生 k8s 中间件

腾讯校招都会问些什么?| 五面腾讯(Java岗)经历分享

Java架构师迁哥

云小课 | 一个三分钟快速定制OCR应用的神器,要不?

华为云开发者联盟

AI modelarts OCR ModelArts Pro 开发套件

15年云原生实践,在关键节点我们做对了什么? | 云原生大咖说

阿里巴巴中间件

Keycloak 13 自定义用户身份认证流程(User Storage SPI)

Zhang

MySQL spi keycloak 13.0.0 user storage spi

被解救的代码 - 代码即服务时代来了!

阿里巴巴云原生

容器 微服务 开发者 云原生 开发工具

新融合,新跳板:智能云网如何让企业数字化转型,起步即领先?

脑极体

中国区块链第一村的价值裂变

CECBC

“碳中和”目标下的绿色金融探索

CECBC

金融

“技术+应用”驱动金融科技创新融合

CECBC

金融

网络攻防学习笔记 Day17

穿过生命散发芬芳

5月日更 网络攻防

对比解读《2020年CNCF中国云原生调查报告》

阿里巴巴中间件

5分钟速读之Rust权威指南(三)

wzx

rust

重磅成果 | 《数据安全治理白皮书3.0》正式对外发布!

DT极客

Dubbo Stub与Mock

青年IT男

dubbo

SpringCloud微服务架构实战:Feign+Hystrix实现RPC调用保护

小Q

Java 学习 面试 微服务 spring cloud alibaba

2021 iOS 进阶学习视频推荐

程序员 ios开发

有无社保缴纳识别接口

ALone

Python--TKinter

若尘

Python编程 5月日更

进大厂的iOS程序员,原来是这样“跳槽”的!

iOS猿_员

基于时间加权的用户购买类目意愿计算_文化 & 方法_Jason_InfoQ精选文章