写点什么

架构 Twitter

  • 2008-06-22
  • 本文字数:1120 字

    阅读完需:约 4 分钟

风行的社交应用Twitter ,其底层架构最近已成为多次讨论的焦点。由于团队试图解决一些问题,Twitter已经有几次停止运行的情况,并关闭了几个常用的功能。从Twitter 的前进脚步之中,我们能学到些什么呢?包括 Om Malik Dare Obasanjo 在内的几个人猜测是 Twitter 的底层架构导致了这些问题的出现。最近,Robert Scoble 就应用情况和公司前景采访了Twitter 的Evan Williams 和Biz Stone 。采访的视频可在 qik 上找到。

在采访中,Williams 和 Stone 回答了关于 Twitter 数据架构的大问题:Twitter 是否使用单实例存储(SIS)类型的方法来处理用户消息?在大约 13 分钟的采访记录中,Williams 谈到了消息存储和用户时间线检索:

它不是这么处理的(为用户的每个跟随者都产生一个消息副本),但实际上这可能更有效率。现在消息存储到数据库中,当人们想获取他们的时间线时,我们从数据 库中构造时间线,然后缓存到内存中,当然不是每次都缓存。但由于内容写入太频繁,我们往往也要频繁地访问数据库,而这只是为了更新缓存。所以缓存中有很多 消息副本,而在磁盘上却只有一条消息。我们以后的架构可能更多的是以多次写入的方式,因为读取在这种方式下将快更多。

从 SIS 消息架构迁移的可能性为利用像数据Sharding 这样的数据技术开启了一扇大门,数据Sharding 技术已经在许多高容量网站和应用中广受欢迎。Randy Shoup谈到了eBay 通过部分利用Sharding 来架构系统的方式,以此获得高可伸缩性:> 数据库层次的问题比较有挑战性,原因是数据天生就是有状态的。我们会按照主要的访问路径对数据做水平分割(或称为“Sharding”)。例如用户数据目 前被分割到20 台主机上,每台主机存放1/20 的用户。随着用户数量的增长,以及每个用户的数据量增长,我们会增加更多的主机,将用户分散到更多的机器上 去。商品数据、购买数据、帐户数据等等也都用同样的方式处理。用例不同,我们分割数据的方案也不同。

Bogdan Nicolau 写过一篇为数据库Sharding 基础的概述。在该系列中,Bogdan 讨论了如何决定在何处、以及如何为应用分割数据。决定时的主要一点是:> 我试图表达的是,无论你选择什么逻辑来切分表,总是要记住你不想有任何join、order by、或limit 语句,这些语句会需要不止一个的表Shards。

Bogdan 继续谈论了应用端对Shards 的利用。Bogdan 提供了几个代码例子来解释一个典型问题,同时还解释了背后的原理:> 正如你所看到的,因为要生成映射表,负担主要落在了写入一方。读取时就不需要关心涉及的数据切分算法了。

随着众人参与关于如何扩展Web 2.0 的讨论,Twitter 也许将继续向一个更稳定、可伸缩的架构迈进。InfoQ 有许多性能和可伸缩性相关的资源,在这里查看这些资源

查看英文原文: Architecting Twitter

2008-06-22 21:402937
用户头像

发布了 151 篇内容, 共 68.4 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

演讲实录 | MaxCompute 智能物化视图

阿里云大数据AI技术

大数据 MaxCompute 智能数仓

Pixea Plus for Mac:轻量高效的图像查看与编辑工具

小玖_苹果Mac软件

淘宝店铺所有商品API接口(淘宝API系列)

tbapi

淘宝API接口 淘宝店铺所有商品接口 淘宝店铺商品采集

打造更 AI 的操作系统 《龙蜥+超级探访》第三期走进浪潮信息

OpenAnolis小助手

AI 操作系统 龙蜥社区 龙蜥+超级探访

iA Writer for Mac:极简写作,专注创作

小玖_苹果Mac软件

MacDroid Pro for Mac:高效管理 Android 设备

小玖_苹果Mac软件

出版社需要采购堡垒机的几种情形简单分析-行云管家

行云管家

网络安全 堡垒机 信息安全、

Beyond Compare 5 for Mac:高效文件对比与同步工具

小玖_苹果Mac软件

TiCDC 新架构试用启程

TiDB 社区干货传送门

8.x 实践

什么是DHCP?DHCP有什么作用?

防火墙后吃泡面

重磅 | Cloud Ace 推出 GenAIOps 服务:加速企业生成式 AI 商业落地

Cloud Ace 云一

人工智能 GenAI GenAIOps

最好用的项目流程管理工具OmniPlan Pro 4 for Mac中文激活版

小玖_苹果Mac软件

功能更新丨HyperMesh:被动安全报告管理器ASRM 2024.1,助力汽车安全开发效率再升级

Altair RapidMiner

汽车 仿真 汽车安全 CAE Hypermesh

Musify for Mac:轻松下载与管理音乐

小玖_苹果Mac软件

ONES 出席华为广东合作伙伴大会,并荣获最佳解决方案伙伴奖

万事ONES

华为云 信创解决方案 研发管理平台 ONES

“零代码”开启AI开发新篇,Infinity Ground Agentic IDE助力

加密眼界

Red Giant for Mac:视觉特效与动态图形的创意引擎

小玖_苹果Mac软件

Mac硬件状态监控工具iStatistica Pro for mac免激活版下载

小玖_苹果Mac软件

25年成都等保测评公司名单汇总

行云管家

等保 等保测评 等保2.0

TiDB Labs云环境测试故障期间数据库零宕机

TiDB 社区干货传送门

实践案例

TiCDC 新版本初体验 tidb->mysql

TiDB 社区干货传送门

8.x 实践 TiCDC新架构

架构Twitter_Ruby_Steven Robbins_InfoQ精选文章