10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

几张图带你看懂今日头条推荐系统

  • 2019-12-30
  • 本文字数:794 字

    阅读完需:约 3 分钟

几张图带你看懂今日头条推荐系统

推荐系统是一个策略行为,本文将用几张图,来带你看懂今日头条的推荐系统。


推荐系统的“前身”


2016 年,腾讯以 80 亿美元估值投资今日头条,结果大家都知道,张一鸣拒绝了腾讯的投资,现在大家也知道,字节跳动估值 750 亿美元,这一切,推荐系统功不可没。


因为搜索引擎和推荐系统太相似,相对来说也更简单(勿喷),所以我们先来了解一下搜索引擎。至于搜素引擎是不是推荐系统的前身,我很懒,没有考察。


如上图,搜索引擎分成为离线部分和在线部分,每一部分有不同的使命。


简单来说,搜索引擎的离线部分,专注于内容的搜集和处理。搜索引擎通过网络爬虫抓取网站上的原始内容,并将内容建立索引。这些内容会根据搜索系统的不同要求建立不同的索引体系,比如新闻类型的内容,会建立时效性的索引数据。


搜索引擎的在线部分,负责响应用户的搜索请求,完成内容的筛选和排序,并将最终结果返回给用户。我们举一个例子来说明这个流程:


用户在搜索引擎输入一个关键词 NBA,搜索引擎搜索会对关键词进行分析、变换、扩充和纠错等处理,比如发现美职篮与 NBA 是同义词,就会将其扩充。


接下来,搜索引擎会通过多种方式从不同索引数据获得候选集,这个环节叫召回。


得到候选集后,搜索引擎通过更精细的计算模型对每一篇候选内容进行分值计算,对候选集的每一项进行排序。


这个时候,还不能将结果展示给用户,需要经过规则干预这一过程。这个过程服务于特定的产品目的。假如有这样一条“官方网站保护规则,确保所有品牌搜索词都可以优先返回官网”,则此时就会将官网插入并置顶,最后再将结果展示给用户。


此时,搜索引擎的工作还未结束。搜索引擎会根据用户的点击反馈去优化排序模型。比如,大部分用户都没有点击文章 10,则文章 10 后续就不会获得更靠前的展现位置。


对以上两图进行总结就是下图,就是想让你们看的第一张图:


本文转载自 Think 体验设计公众号。


原文链接:https://mp.weixin.qq.com/s/8FSAn442599YCR-WfvWkFQ


2019-12-30 18:114168

评论

发布
暂无评论
发现更多内容

天天向上跑分模式介绍开发

luluhulian

工业绿色哪家强?3D可视化盾构机构建隧道,推动设备预测性运维

一只数据鲸鱼

物联网 数据可视化 绿色交通 绿色工业 盾构机

图解分析:Kafka 生产者客户端工作原理

李尚智

Java 程序员 架构 kafak

浪潮云洲工业互联网平台创新实践,受权威机构关注!

工业互联网

电子书下载|2020 年云原生年货小红书来啦!

阿里巴巴云原生

容器 微服务 开发者 云原生 k8s

即构发布 LCEP 低代码互动平台产品 RoomKit,实现互动房间0代码搭建

ZEGO即构

Elasticsearch 搜索结果解析

escray

elastic 七日更 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

使用logstash作为docker日志驱动收集日志

远鹏

Docker Logstash 日志系统

【JS】事件委托

德育处主任

JavaScript 大前端 js 2月春节不断更

程序员成长第四篇:程序员的职业天花板

石云升

28天写作 2月春节不断更 职场天花板

终于搞懂了Python模块之间的相互引用问题

华为云开发者联盟

Python 路径 代码 模块

看KubeEdge携手K8S,如何管理中国高速公路上的10万边缘节点

华为云开发者联盟

Kubernetes 微服务 kubeedge 边缘

使用V8和node轻松profile分析nodejs应用程序

程序那些事

性能优化 Profile nodejs 性能分析 程序那些事

深度集成 Flink: Apache Iceberg 0.11.0 最新功能解读

Apache Flink

flink

产品经理:一款用户全量会话轨迹管理产品是怎么炼成的?

博睿数据

架构师训练营大作业

Geek_f06ede

redis分布式锁的这些坑,我怀疑你是假的开发

华为云开发者联盟

redis 分布式 分布式锁 服务器 value

零基础实现Java直播(二):实现流程

ZEGO即构

Kafka 发送消息过程中拦截器的用途?

李尚智

Java kafka 程序员 架构

CSS开发过程中的20个快速提升技巧

华为云开发者联盟

CSS

关于京东技术,你想了解的都在这里丨征文活动获奖及优秀专栏推荐

京东科技开发者

京东 征文大赛

架构师训练营大作业(二)

Geek_f06ede

IDEA永久注册码来了!!!(支持2020.3.1版本)

程序员生活志

IDEA

怎么理解Kafka消费者与消费组之间的关系?

李尚智

Java 大数据 程序员 架构

2021年的十五个DevOps趋势预测

禅道项目管理

DevOps 微服务 自动化 趋势

【无偿分享】史上最全Python学习大礼包

sum56

Python 学习 学习方法 python 爬虫 资料整理

一款基于 Web 的通用数据管理工具(转载)

BinTools图尔兹

数据库 运维 开发工具 dba 数据管理工具

目前的区块链IPFS矿机模式交易系统开发的简单解析

v16629866266

并发队列:PriorityBlockingQueue和DelayQueue案例使用

叫练

并发编程 队列 优先级队列 条件队列 并发队列

2021版阿里Java亿级并发设计手册:基础+数据库+缓存+消息队列+分布式+维护+实战

Java架构追梦

Java 阿里巴巴 面试 系统架构 亿级并发

长篇总结之JavaScript,巩固前端基础

我是哪吒

JavaScript 程序员 面试 大前端 2月春节不断更

几张图带你看懂今日头条推荐系统_语言 & 开发_Think体验设计_InfoQ精选文章