基于行列式点过程的推荐多样性提升算法_语言 & 开发_DataFunTalk

限时领｜《AI 百问百答》专栏课+实体书（包邮）！了解详情 



 写点什么

一、推荐系统目标

推荐系统的目标主要包含两个方面：Exploitation 和 Exploration。

在 Exploitation 中最重要的是 Relevance ( 相关性 ) 的计算，其根本思想是根据用户浏览、观看和收藏的内容等用户行为数据推测该用户可能采取的行动。常见的推荐算法大多是基于针对该目标的优化而展开的。

然而用户行为数据在现实中很可能过少、不足以全面地体现用户的兴趣。这一现象在冷启动等场景中很常见。此时推荐系统还有责任挖掘用户尚未表现出的兴趣，并且避免由于现有行为数据过少而导致推送内容相似性过高的情况。这就需要引入 Exploration。

Exploration 主要有三个方面：

覆盖度：被推荐给用户的内容占全部内容的比例应该较高，特别是新的内容能够有机会展现给用户。
惊喜：推荐的内容并不与用户之前的行为明显相关，但又是用户所喜欢的。这能很大程度提升用户体验，但却难以给出衡量指标。
多样性：在短时间内不要过多地向同一用户推荐同一类型的内容，而是混合各种类型的内容推荐给用户。衡量这一指标主要通过三个方面，接下来将逐一介绍。

二、如何衡量推荐内容的多样性？

2.1、Temporal Diversity ( 时间的多样性 )

推荐结果应随着时间的迁移发生改变，其衡量的指标是在固定的时间间隔内推荐不同类的内容的个数。比如一个推荐系统在一段时间内给用户推荐了 10 个内容，那么这 10 个内容中属于不同类别的个数，即可衡量推荐系统的多样性。

对于这个指标的提升主要有三个方式来提升这个指标：

第一个类似于 Item-based CF 的思想，预先根据所有用户的历史偏好数据计算内容之间的相似性，然后推荐与该用户的喜好相类似的内容。

第二个是针对用户的行为做一个时间上的衰减，这样能够针对老用户增大他观看新类型结果的变化。

第三个是 Impression discount ( 印象折扣 ) ，统计所有推荐给用户的内容中哪些是用户没有观看的类型，降低该类型的曝光度，从而给其他类型的内容增加更多的曝光机会。

2.2、Spatial Diversity ( 空间的多样性 )

它的衡量指标是单个推荐列表中物品之间的差异程度，可以通过计算在同一个推荐 list 中两两 Item 之间的相似度的平均值来进行衡量。

接下来我们将详细介绍该方面内容：

首先我们为什么关注这样一个指标呢？这是因为在推荐系统中我们只关注准确性指标的话，那么会导致推荐出来的内容大部分都相似。

在上面这幅图中，每一个点代表一个 Item ，横坐标表示物品之间的相似性，横坐标越近表示物品的相似性越高，纵坐标表示推荐系统对 Item 的打分。

在左图中有个用户观看了一个 Item 用红点表示，那么推荐系统会根据这个行为推荐 10 内容给用户，那么这 10 个内容和这个 Item 相似度非常高。

在右图这个例子中，一个用户观看了三个内容，其中 Item1 和 Item2 的相似度非常高，和 Item3 的相似度非常低，那么推荐系统根据用户的行为推荐 Top10 的内容的话，会发现这 10 个内容都与 Item1 和 Item2 相似。这是个很常见的例子，比如一个用户很喜欢看漫威的电影，也喜欢看一些文艺类的电影，其中用户观看漫威的电影比较多一些，看文艺类的电影少一些，那么推荐系统很容易造成推荐的时候只推荐漫威类的电影。

用户多样性的问题也已经被广泛研究过。传统上使用启发式的方法，它会在多样性和相关性之间用一个加权平均的方法来获得一个总体的优化目标，然后两两之间比较当前推荐的差异性，然后试图最大化这个总的平衡了之后的优化目标，用穷举的方法。

提升推荐系统多样性的方式主要有两类。第一类主要是依靠 Item 相似度模型和 Item 排序模型。如图 5 左侧所示。另一类主要是直接去修改推荐算法，使得这个推荐算法推荐出来的 Item 尽可能的不相似，如图 5 右侧所示。

三、行列式过程推荐多样性提升算法

DPP 的构造

行列式点过程 ( Determinantal Point Process , DPP ) 是一种性能较高的概率模型。DPP 将复杂的概率计算转换成简单的行列式计算，并通过核矩阵的行列式计算每一个子集的概率。DPP 不仅减少了计算量，而且提高了运行效率，在图片分割、文本摘要和商品推荐系统中均具有较成功的应用。

DPP 通过最大后验概率估计，找到商品集中相关性和多样性最大的子集，从而作为推荐给用户的商品集。

行列式点过程刻画的是一个离散集合 Z={1,2,3…,M} 中每一个子集出现的概率。当给定空集合出现的概率时，存在一个由集合的元素构成的半正定矩阵 $L \subseteq R^{M \times M}$ ，对于每一个集合 Z 的子集 Y ，使得子集 Y 出现的概率 $P (Y) \propto d e t (L_{Y})$ ，其中，L_Y 表示由行和列的下标属于 Y 构成的矩阵 L 的子矩阵。可以看看下面的例子：