几张图带你看懂今日头条推荐系统

阅读数:1 2019 年 12 月 30 日 18:11

几张图带你看懂今日头条推荐系统

推荐系统是一个策略行为,本文将用几张图,来带你看懂今日头条的推荐系统。
推荐系统的“前身”

2016 年,腾讯以 80 亿美元估值投资今日头条,结果大家都知道,张一鸣拒绝了腾讯的投资,现在大家也知道,字节跳动估值 750 亿美元,这一切,推荐系统功不可没。

因为搜索引擎和推荐系统太相似,相对来说也更简单(勿喷),所以我们先来了解一下搜索引擎。至于搜素引擎是不是推荐系统的前身,我很懒,没有考察。

如上图,搜索引擎分成为离线部分和在线部分,每一部分有不同的使命。

简单来说,搜索引擎的离线部分,专注于内容的搜集和处理。搜索引擎通过网络爬虫抓取网站上的原始内容,并将内容建立索引。这些内容会根据搜索系统的不同要求建立不同的索引体系,比如新闻类型的内容,会建立时效性的索引数据。

搜索引擎的在线部分,负责响应用户的搜索请求,完成内容的筛选和排序,并将最终结果返回给用户。我们举一个例子来说明这个流程:

用户在搜索引擎输入一个关键词 NBA,搜索引擎搜索会对关键词进行分析、变换、扩充和纠错等处理,比如发现美职篮与 NBA 是同义词,就会将其扩充。
接下来,搜索引擎会通过多种方式从不同索引数据获得候选集,这个环节叫召回。
得到候选集后,搜索引擎通过更精细的计算模型对每一篇候选内容进行分值计算,对候选集的每一项进行排序。
这个时候,还不能将结果展示给用户,需要经过规则干预这一过程。这个过程服务于特定的产品目的。假如有这样一条“官方网站保护规则,确保所有品牌搜索词都可以优先返回官网”,则此时就会将官网插入并置顶,最后再将结果展示给用户。
此时,搜索引擎的工作还未结束。搜索引擎会根据用户的点击反馈去优化排序模型。比如,大部分用户都没有点击文章 10,则文章 10 后续就不会获得更靠前的展现位置。
对以上两图进行总结就是下图,就是想让你们看的第一张图:

本文转载自 Think 体验设计公众号。

原文链接: https://mp.weixin.qq.com/s/8FSAn442599YCR-WfvWkFQ

评论

发布