构建生产可用的推荐系统需要注意哪些问题？_架构_赵钰莹



 写点什么

虽然经历了几十年的研究和发展，推荐系统已经成了各种现代网络应用中不可或缺的组成部分，但是推荐系统的研究和应用仍然面临着很多重要而急迫的挑战，推荐系统的应用形式和场景也蕴含着更多的可能。本节，我们总结归纳目前推荐系统在研究和应用方面所面临的一些重要问题，同时指出推荐系统在研究和应用上的一些潜在方向，以使读者对推荐系统的未来发展拥有一些认识。

推荐系统的新方向

1．基于多源异质信息的推荐

长期以来，推荐系统的各种算法和研究都是基于数值化打分矩阵的形式化模型，该模型的核心是以用户打分为基础，而少有对基于用户文本评论语料进行个性化推荐的研究。基于文本评论的个性化推荐被很多论文提到，但是研究并不深入，这一方面限于文本挖掘技术的研究遇到很多难点，另一方面限于之前网络上积累的文本信息还不够多。随着 Web 2.0 网络的兴起，互联网上所积累的用户文本信息越来越多，已经成为一种不可忽略的信息来源，如电子购物网站中的用户评论、社交网络中的用户状态，等等。这些文本信息对于了解用户兴趣、发掘用户需求有极其重要的作用，如何充分利用这些数值评分之外的文本信息进行用户建模和个性化推荐具有重要的意义。

2．推荐系统与人机交互的关系

推荐系统与用户的交互方式也是相关领域内研究的热点方向。目前常见的实际系统一般以推荐列表的形式给出推荐，然而一些研究表明，即便是同样的打分和评价系统，如果展示给用户的方式不同，也会对用户的使用、评价、效果产生一定的影响。例如，MovieLens 小组第一次研究了用户打分区间、连续打分还是离散（如星标）打分、推荐系统主动欺骗等对用户使用推荐系统造成的影响。与搜索引擎一样，推荐系统的界面设计和交互方式也越来越受到研究人员的关注。

3．长尾效应与小众推荐

长尾效应在推荐系统中的理解和应用可以为进一步提高系统的推荐效果打开新的窗户。一个推荐系统的性能不能直接以预测评分的精确度测量，而应该考虑用户的满意度。推荐系统应该以“发现”为终极目标，而现存的一些推荐技术通常会倾向于推荐流行度很高的，用户已经知道的物品。这样存在于长尾中的物品也就不能很好地推荐给相应的用户了。但是，这些长尾物品通常更能体现用户的兴趣偏好。

所以，在推荐系统的设计过程中，不仅要考虑预测的精度，还要考虑用户真正的兴趣点在哪里。研究人员也开始考虑长尾效应在推荐系统设计过程中的应用，并考虑如何将长尾物品推荐给用户，以及如何为小众用户推荐合适的物品。

4．可解释性推荐

推荐系统的可解释性成为一个重要的研究课题。随着实际系统中的数据越来越多、规模越来越庞大、算法越来越复杂，包括推荐系统在内的智能决策系统变得越来越黑箱化，系统难以给出直观可信的解释来告诉用户为什么要做特定的决策。

在此背景下，推荐系统的可解释性变得越来越重要，研究人员正在试图构建可解释的推荐算法和模型，使得系统不仅可以给出推荐结果，还可以自动给出恰当的推荐理由。

5．推荐系统的商业价值

推荐系统所能实现的价值也是个性化推荐的一个重要问题。在已有的绝大多数推荐系统中，算法往往只关心准确率、点击率、购买率等指标，很多推荐算法也是围绕着对 RMSE、Precision、NDCG 等指标的优化而设计的。然而被推荐的物品未必会被用户购买，即便被用户购买，不同物品为系统带来的价值也是不一样的。因此，如何直接优化推荐系统对平台的价值也是一个重要的演进方向，有助于帮助推荐系统通过推荐恰当的物品，直接优化和提升系统带来的实际效益。

例如，阿里巴巴通过直接优化推荐列表的商业价值来构建推荐列表（Pei, et al.,2019），在这一方向上做出了尝试。

6．多平台协作式推荐

越来越多的生活项目日益网络化，在网络上造成了一个个信息孤岛：每一个网络应用平台拥有用户在该平台或该领域内的行为信息，了解用户在该平台和领域内的行为偏好，从而可以在该领域内给出个性化的专业服务；然而在不同平台和领域之间，尤其是异质领域（如视频和购物）之间，用户的行为线索并没有被打通，每一个平台和领域没有其他平台和领域的用户行为信息，也就难以给出平台之外其他领域的个性化服务。这些独立的信息孤岛将网络用户原本完整而流畅的生活时间线割裂，未能形成浑然一体的个性化服务流程，使得互联网本应在人们日常生活中所起的重要甚至核心作用大打折扣。

因此，如何由互联网所连接的各个系统协作式地发掘用户潜在需求，适时地给出跨领域的异质推荐结果和个性化服务成为推荐系统向通用推荐引擎方向发展的重要问题和研究前沿，并将极大地降低人们使用互联网的时间和精力成本，免去在各个独立服务之间进行切换和查找的麻烦。更重要的是，不同类型的异质商品或服务之间的信息联通和相互推荐，蕴含着全新的互联网运营和盈利模式。例如，通过从历史数据中进行任务挖掘，旅行机票订购网站可以通过异质推荐为酒店预订、车辆租赁、团队预订等多种潜在的关联网站带来流量，并从中获得额外收益；视频服务商可以通过异质推荐给出来自购物网站的商品推荐，从而实现虚拟产业收入与实物商品收入的结合，这对促进产业协作发展和产业整合具有重要意义。

本文内容节选自图书《大数据智能》，感兴趣的用户欢迎点击链接了解：https://item.jd.com/12603411.html?dist=jd

发布

暂无评论

创作场景

构建生产可用的推荐系统需要注意哪些问题？

推荐系统面临的问题

1．推荐的冷启动问题

2．个性化推荐的可解释性问题

3．推荐系统的防攻击能力