写点什么

几张图带你看懂今日头条推荐系统

  • 2019-12-30
  • 本文字数:794 字

    阅读完需:约 3 分钟

几张图带你看懂今日头条推荐系统

推荐系统是一个策略行为,本文将用几张图,来带你看懂今日头条的推荐系统。


推荐系统的“前身”


2016 年,腾讯以 80 亿美元估值投资今日头条,结果大家都知道,张一鸣拒绝了腾讯的投资,现在大家也知道,字节跳动估值 750 亿美元,这一切,推荐系统功不可没。


因为搜索引擎和推荐系统太相似,相对来说也更简单(勿喷),所以我们先来了解一下搜索引擎。至于搜素引擎是不是推荐系统的前身,我很懒,没有考察。


如上图,搜索引擎分成为离线部分和在线部分,每一部分有不同的使命。


简单来说,搜索引擎的离线部分,专注于内容的搜集和处理。搜索引擎通过网络爬虫抓取网站上的原始内容,并将内容建立索引。这些内容会根据搜索系统的不同要求建立不同的索引体系,比如新闻类型的内容,会建立时效性的索引数据。


搜索引擎的在线部分,负责响应用户的搜索请求,完成内容的筛选和排序,并将最终结果返回给用户。我们举一个例子来说明这个流程:


用户在搜索引擎输入一个关键词 NBA,搜索引擎搜索会对关键词进行分析、变换、扩充和纠错等处理,比如发现美职篮与 NBA 是同义词,就会将其扩充。


接下来,搜索引擎会通过多种方式从不同索引数据获得候选集,这个环节叫召回。


得到候选集后,搜索引擎通过更精细的计算模型对每一篇候选内容进行分值计算,对候选集的每一项进行排序。


这个时候,还不能将结果展示给用户,需要经过规则干预这一过程。这个过程服务于特定的产品目的。假如有这样一条“官方网站保护规则,确保所有品牌搜索词都可以优先返回官网”,则此时就会将官网插入并置顶,最后再将结果展示给用户。


此时,搜索引擎的工作还未结束。搜索引擎会根据用户的点击反馈去优化排序模型。比如,大部分用户都没有点击文章 10,则文章 10 后续就不会获得更靠前的展现位置。


对以上两图进行总结就是下图,就是想让你们看的第一张图:


本文转载自 Think 体验设计公众号。


原文链接:https://mp.weixin.qq.com/s/8FSAn442599YCR-WfvWkFQ


2019-12-30 18:114427

评论

发布
暂无评论
发现更多内容

Elasticsearch开源仓库404 7万多star一夜清零

吴脑的键客

数据库 搜索引擎

智慧停车系统(源码+文档+部署+讲解)

深圳亥时科技

Llama 3.2 Vision & Molmo:多模态开源生态系统基础

Baihai IDP

程序员 AI Baihai IDP Llama 3.2 Vision Molmo

Emeritus硅谷AI深度研学之旅圆满落幕,探索AI前沿投资洞察!

科技汇

10分钟写一个tidb-ai机器人帮你解答tidb问题

TiDB 社区干货传送门

新版本/特性解读

TiDB数据库出现性能问题,如何利用数据库性能诊断工具DBdoctor一分钟诊断!

TiDB 社区干货传送门

性能调优 实践案例 管理与运维 安装 & 部署 应用适配

TiDB Vector 本地部署体验

TiDB 社区干货传送门

8.x 实践 TiDB Cloud TiDB Vector

TiKV Raft Store 内存管理的原理与实现丨TiKV 源码解读(二十三)

TiDB 社区干货传送门

基于微服务SDK框架与JavaAgent技术,低成本助力应用高效发布

华为云开发者联盟

微服务 灰度发布 java-agent Java Chassis 3

商协会管理系统(源码+文档+部署+讲解)

深圳亥时科技

用二维码展示信息,有哪些常见应用场景

草料二维码

TiDB br日志备份PermissionDenied

TiDB 社区干货传送门

实践案例 备份 & 恢复

TiDB 集群组件间开启 TLS(双向认证

TiDB 社区干货传送门

7.x 实践

GreptimeDB vs. SQLite —— 高通 8155 平台上的性能对比报告

Greptime 格睿科技

sqlite 数据库 边缘计算 嵌入式 性能报告

Merge-region 原理及常见问题

TiDB 社区干货传送门

故障排查/诊断

观测云:简化复杂的云账单,让企业轻松掌控云成本

观测云

云账单

【论文速读】| APILOT:通过避开过时API陷阱,引导大语言模型生成安全代码

云起无垠

知乎 PB 级数据:超大规模TiDB集群管控实践

TiDB 社区干货传送门

实践案例 集群管理 数据库架构设计 HTAP 场景实践

大数据集群搭建,CDH让你事半功倍!

敏捷调度TASKCTL

cloudera CDH 集群搭建 CDH 大数据 Hadoop 集群迁移

软件测试学习笔记丨Flask框架-集成Swagger文档

测试人

软件测试

1024程序员节 | 华为与开发者共筑智能应用新生态

极客天地

突破 RAG 局限,KAG 专业领域知识服务框架正式开源!

可信AI进展

实验室辅助管理系统(源码+文档+部署+讲解)

深圳亥时科技

人工智能如何从神话走向科学的?

天津汇柏科技有限公司

人工智能 AI 人工智能

鸿蒙网络编程系列42-仓颉版域名解析示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

CST如何进行局部网格剖分

思茂信息

cst cst使用教程 电磁仿真

ChatGPT Search 上线 允许用户像使用搜索引擎一样完成即时搜索

吴脑的键客

ChatGPT Azure OpenAI

HyperWorks二维网格划分及拓扑改进

智造软件

Hypermesh 网格划分 有限元

几张图带你看懂今日头条推荐系统_语言 & 开发_Think体验设计_InfoQ精选文章