写点什么

知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计

  • 2019-08-17
  • 本文字数:829 字

    阅读完需:约 3 分钟

知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计

QCon广州2019大会上,孙晓光讲师做了《知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计》主题演讲,主要内容如下。


演讲简介


知乎从问答起步在过去的 8 年中逐步成长为一个大规模的综合性知识内容平台,今天在知乎站上有多达 38 万个话题,超过 2800 万个问题总共收获了超过 1.3 亿个回答,同时知乎还沉淀了数量众多的优质文章、电子书以及其他付费内容。知乎通过个性化首页推荐的方式在海量的信息中高效的分发用户感兴趣的优质内容。为了避免给用户推荐重复的内容,首页会记录下所有给用户推荐过的内容长期保存。直至今天知乎已读的数据规模已超过万亿并以每天接近 30 亿的速度持续增长,实时、可靠且高效的存储和查询已读数据存在着诸多挑战。在过去的一年多已读服务的架构在承载着 40000/s 新数据写入的同时还支撑着峰值每秒 30000 条独立请求和 1200 万文档已读状态的查询,并且在大流量的冲击下响应时间依旧稳定维持在 P99 24ms 以及 P999 45ms 的低水位线。在本次演讲中我们会分享目前知乎已读服务的整体架构以及我们如何在这个架构上应对各种挑战满足业务需求,希望这个分享能为大家开拓解决类似问题的思路。


内容大纲


  1. 业务场景:知乎个性化首页利用已读过滤服务高效率分发用户未阅读过的优质内容 。

  2. 服务架构:知乎目前已读数据已经达万亿条量级并且还在以更快的加速度持续增长,而缓存系统则是万亿规模数据集高吞吐低时延的关键点。已读服务通过将缓冲智能化来应对数据频繁更新和数据高度稀疏对缓存系统在一致性和命中率方面的挑战。

  3. 原生分布式数据库的迁移代价和海量数据集下的收益。


听众受益


  1. 大量更新的海量数据缓存系统设计;

  2. 缓存一致性的考量和取舍;

  3. 原生分布式数据库的迁移成本和巨大收益。


讲师介绍


孙晓光


知乎 搜索后端负责人


知乎搜索后端负责人,目前承担知乎搜索后端架构设计以及工程团队的管理工作。曾多年从事私有云相关产品开发工作关注云原生技术,TiKV 项目 Committer。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2019/guangzhou/schedule


2019-08-17 00:009914

评论

发布
暂无评论
发现更多内容

架构师训练营第七周作业 - 命题作业

阿德儿

如何检测社交网络中两个人是否是朋友关系(union-find算法)

Silently9527

程序员 算法和数据结构 union-find

android开发需要学什么!最全面试考点与面试技巧,已拿offer附真题解析

欢喜学安卓

android 程序员 面试 移动开发

Koa中间件体系的重构经验

智联大前端

node.js 大前端 单元测试 重构 koa

阿里开发7年大牛:Android事件分发机制及设计思路,分享PDF高清版

欢喜学安卓

android 程序员 面试 移动开发

工作日志2-20

技术骨干

Eureka 部分机制记录

常清静

Spring Cloud 原理 Eureka

关于星座的趣谈「Day 2」

道伟

28天写作

【vue2 & G6】快速上手

德育处主任

大前端 可视化 数据可视化 G6 antv/g6

(28DW-S8-Day2) 在线教育的本质

mtfelix

28天写作 在线教育的本质特点

第十三周课后练习

Binary

创业公司如何搭建自己的领导班子

一笑

28天写作

1.1 Go语言从入门到精通:开发环境搭建

xcbeyond

vscode 环境安装 28天写作 Go 语言

基于证券云服务的总体架构设计应该怎么做?

Jason Tien

架构师训练营第七周作业 - 学习总结

阿德儿

十二周作业&总结

胡益

甲方日常 92

句子

工作 随笔杂谈 日常

Kafka.04 - Kafka 部署

insight

kafka 2月春节不断更

28天瞎写的第二百四十天:我与正念的故事

树上

冥想 28天写作 正念 焦虑 平静

管理笔记【10】十二条给管理者的人事管理经验

L3C老司机

28天写作

SICP 习题解答 1.6

十元

第13周学习总结

Binary

第五周作业-线下核销优惠券流程图

隋泽

产品经理训练营

魂牵梦绕——俄罗斯方块效应

Justin

心理学 28天写作 游戏设计

刚学会 C++ 的小白用这个开源框架,做个 RPC 服务要多久?

HelloGitHub

c++ GitHub 开源 RPC

测试InfoQ 平台发布文章

木子的昼夜

浅谈EMC电磁兼容设计—概念篇

不脱发的程序猿

28天写作 二月春节不断更 电路设计 EMC 电磁兼容

笑说设计模式-小白逃课被点名

happlyfox

28天写作

一种C++中支持界面调用函数的实现方法

长不胖的Garfield

详解SSH 框架中对象调用流程

华为云开发者联盟

spring hibernate struts SSH 框架

私有云、公共云、混合云安全性的优点和缺点

云计算

知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计_QCon_孙晓光_InfoQ精选文章