2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

几张图带你看懂今日头条推荐系统

  • 2019-12-30
  • 本文字数:794 字

    阅读完需:约 3 分钟

几张图带你看懂今日头条推荐系统

推荐系统是一个策略行为,本文将用几张图,来带你看懂今日头条的推荐系统。


推荐系统的“前身”


2016 年,腾讯以 80 亿美元估值投资今日头条,结果大家都知道,张一鸣拒绝了腾讯的投资,现在大家也知道,字节跳动估值 750 亿美元,这一切,推荐系统功不可没。


因为搜索引擎和推荐系统太相似,相对来说也更简单(勿喷),所以我们先来了解一下搜索引擎。至于搜素引擎是不是推荐系统的前身,我很懒,没有考察。


如上图,搜索引擎分成为离线部分和在线部分,每一部分有不同的使命。


简单来说,搜索引擎的离线部分,专注于内容的搜集和处理。搜索引擎通过网络爬虫抓取网站上的原始内容,并将内容建立索引。这些内容会根据搜索系统的不同要求建立不同的索引体系,比如新闻类型的内容,会建立时效性的索引数据。


搜索引擎的在线部分,负责响应用户的搜索请求,完成内容的筛选和排序,并将最终结果返回给用户。我们举一个例子来说明这个流程:


用户在搜索引擎输入一个关键词 NBA,搜索引擎搜索会对关键词进行分析、变换、扩充和纠错等处理,比如发现美职篮与 NBA 是同义词,就会将其扩充。


接下来,搜索引擎会通过多种方式从不同索引数据获得候选集,这个环节叫召回。


得到候选集后,搜索引擎通过更精细的计算模型对每一篇候选内容进行分值计算,对候选集的每一项进行排序。


这个时候,还不能将结果展示给用户,需要经过规则干预这一过程。这个过程服务于特定的产品目的。假如有这样一条“官方网站保护规则,确保所有品牌搜索词都可以优先返回官网”,则此时就会将官网插入并置顶,最后再将结果展示给用户。


此时,搜索引擎的工作还未结束。搜索引擎会根据用户的点击反馈去优化排序模型。比如,大部分用户都没有点击文章 10,则文章 10 后续就不会获得更靠前的展现位置。


对以上两图进行总结就是下图,就是想让你们看的第一张图:


本文转载自 Think 体验设计公众号。


原文链接:https://mp.weixin.qq.com/s/8FSAn442599YCR-WfvWkFQ


2019-12-30 18:113993

评论

发布
暂无评论
发现更多内容

快速认识 WebAssembly

devpoint

rust webassembly Wasm 6月月更

Spring Security:用户和Spring应用之间的安全屏障

华为云开发者联盟

安全 防火墙 spring security 华为云

2022年秋季广州美博会-2022广州9月份美博会

Geek_0b38bb

2022年广州美博会 秋季广州美博会 美博会 广州美博会

OLAP分析型应用场景中,数仓中vacuum为何对列存表无效

华为云开发者联盟

数据库 后端 存储 华为云

el-table 分页全选功能讲解

CRMEB

一个老开源人的自述-如何干好开源这件事

云智慧AIOps社区

开源 前端 开源项目 数据可视化

什么是网络拓扑?网络拓扑有哪些类型?

wljslmz

网络技术 6月月更 网络拓扑

Wallys/Routerboard/DR8072A-HK09/IPQ8072A/802.11ax

wallys-wifi6

802.11AX WIFI 6e

TiDB 性能分析&性能调优&优化实践大全

TiDB 社区干货传送门

7天免费入门数据智能,“2022数据智能夏令营”开启报名!

个推

人工智能 大数据 数据智能

游戏源代码开发时需要什么,需要哪些团队成员?

开源直播系统源码

软件开发 游戏开发 直播源码

并发数、并发以及高并发分别是什么意思?

行云管家

高并发 并发 堡垒机 IT运维 并发数

大数据培训Flink之Table API 与 SQL

@零度

flink 大数据开发

福昕软件重磅发布福昕高级PDF编辑器12.0

联营汇聚

电竞迎来“新四化”,数字化产业变革正当时

科技之家

快速玩转CI/CD图形化编排

Jianmu

DevOps 前端 CI/CD 自动化运维 图形化编排

文旅新体验!3DCAT助力广州非遗“元宇宙”街区炫酷亮相

3DCAT实时渲染

非遗 元宇宙 实时云渲染

Webshell检测引擎:青藤开放200个雷火SaaS版免费账号!

青藤云安全

安全攻防 网络安全 攻防演练

通过一个具体的例子,讲解 SAP Cloud Platform Integration(CPI) 的使用方法

汪子熙

Cloud 系统集成 SAP 6月月更 cpi

Java开发培训之设计模式UML类图

@零度

JAVA开发 UML

低代码实现探索(四十三)前台对象数据树

零道云-混合式低代码平台

Node.js实用的内置API(二)

devpoint

node.js utils 6月月更

详细视图——基于函数的视图 Django

海拥(haiyong.site)

Python django 6月月更

Fabric.js 控制元素层级 👑

德育处主任

前端 canvas Fabric.js 6月月更

数据平台调度升级改造 | 从Azkaban 平滑过度到 Apache DolphinScheduler 的操作实践

白鲸开源

Apache 大数据 开源 workflow

K8s的负载均衡与配置管理

Damon

云原生 k8s 6月月更

大数据培训之Flink CEP 的简介

@零度

大数据 flink CEP

【CVPR2022】用于域适应语义分割的域无关先验

华为云开发者联盟

人工智能 华为云 图像域

知识管理——知识经济时代的增资利器

小炮

强推10款Python常用的开发工具

左手の明天

Python ide python开发工具

特别干的干货!!《Mycat》搭建分布式数据库中间件看他就够

迷彩

mycat 分布式数据库中间件 6月月更

几张图带你看懂今日头条推荐系统_语言 & 开发_Think体验设计_InfoQ精选文章