写点什么

Digg 与 Reddit 加入 NoSQL 阵营

  • 2010-03-25
  • 本文字数:1571 字

    阅读完需:约 5 分钟

Digg 和 Reddit 在这个月都宣布了将转向 Cassandra ,因为 MySQL 对他们来说伸缩性不够了。一些人认为 MySQL+memchche 不再是事实上的伸缩解决方案了。

Digg 在去年九月宣布了他们转向 Cassandra 的计划,而这一过程在这个月完成了。仔细比对了其它项目——HBase,Hypertable,Tokyo Cabinet/Tyrant,Voldemort,以及 Dynomite——,他们最终选择了 Cassandra,出于以下的考虑:

每个系统都有它自己的强项和弱项,但是 Cassandra 综合了各个方面。它提供了面向列的数据存储,因此这相比纯粹的 key/value 存储又更结构化一些。它通过分布式高可用的点对点集群来运作。尽管目前它的核心功能还有一些欠缺,但相较于其它方案而言,它更接近我们想要的。

Digg 几乎重建了整个基础设施,跳出了 LAMP 栈。主要的起因是 MySQL,如同任何其它的 SQL 数据库一样,它是为读取而作的优化,而不能很好的处理写入:

我们不再使用用 MySQL 的主要动机,是因为要在一个快速增长看不到头的数据集上,构建一个高性能密集写入的应用越来越困难了。这种增长迫使我们使用水平和垂直的分区策略,这就消除了关系型数据所带来的大部分价值了,同时仍然会产生各种开销…

随着我们系统的扩张,跨越多个数据中心的冗余,网络性能,以及增加容量和无宕机时间的更换失效节点对我们来说就尤为重要。我们计划继续使用廉价硬件,并假设失效是平常的。这些都为 MySQL 增加了难度。

另一个网站,Reddit,曾经出现过 memcacheDB 相关的问题,一开始他们通过增加更多的 RAM 来处理,但他们需要一个长久的解决方案是再明显不过的。他们在十天之内完成了向Cassandra 的转换,在Cassandra 开发者和社区的帮助以及EC2 在测试和部署Cassandra 的实例方面的支持下,只用了一名开发者就做到了。

因为许多重要的网站,比如Facebook 或Twitter,都已经在使用或者计划迁移到Cassandra,一些人声称 MySQL+memcached 作为事实的伸缩性解决方案的时代结束了。Todd Hoff 并不认为 MySQL 将会在即将来到的某个时间消失,但它不会再代表首位的解决方案:

从一个小的角度来看,很清楚 MySQL+memcached 的时代已经过去了。它会坚持一段时间。旧的技术很少完全的消失。一些人仍在骑马。一些人还在使用 CD。而因特网也不会完全取代电视这种古老的电磁广播技术,但大多数将会奔向一个新的时代…

我们很清楚 MySQL+memcached 背后的许多思想都是说到了点子上的,这些都在新的系统里得到了保留,只是它的实现显得有点笨重。开发者参与进来,铺平了缺口,磨掉了棱角,创建了一个新的强健的平台,其本身成为了新生态系统和新时代的根基。

对于 Hoff 所说的"很清楚 MySQL+memcached 的时代已经过去了",Mark Atwood 表示不同的意见,他认为 memcached 仍将会长期得到应用

memcached 作为实现伸缩速度的前沿技术这一时代或许"过去"了,但这并不是因为 memcached 失败,而是因为另外的技术 (并不是替代,而是补充) 正在涌现…

但这不会是 memcached 的终结。可以说,这一高性能的 key-value 存储仍将是一个有用的构建模块,不管是对于其自身,还是作为其它的技术组件的子组件。

我肯定 memcache 将会继续演化。将会有更多的实现,更多的局限将会被移除,将会有更多的管理工具,还有更多的系统加上 memcached 的网络协议,而一些 ORMs 框架在构建时就会假设 memcached 可用,将会有协议方面的特性以及在共享托管和云环境方面的实现。

Hoff 后来在他文章的评论中又说到:“我并不是想说缓存将会消失或者 MySQL 将会消失。我坚定的相信内存将是新的硬盘这一概念…所过去了的是 MySQL 与 memcached,相辅相成的,作为开发可伸缩系统的默认平台。”

尽管 MySQL 与 memcache 仍将会是伸缩性问题的良好解决方案,但已经有新的 non-SQL 方案产生了,而它们看起来能为超大规模的系统带来更好的结果。

查看英文原文: Digg and Reddit Have Joined the NoSQL Camp

2010-03-25 07:584226
用户头像

发布了 133 篇内容, 共 42.5 次阅读, 收获喜欢 1 次。

关注

评论

发布
暂无评论
发现更多内容

万字带你走过数据库的这激荡的三年

NebulaGraph

数据库

破局数据分析滞后难题,赋能企业高速增长的指标管理解决方案

袋鼠云数栈

指标体系 指标 指标管理

Bored Ape Yacht Club NFT 概览与数据分析

Footprint Analytics

NFT

熟悉TiDB运维管理工具之TiUP(一)

TiDB 社区干货传送门

管理与运维

黄东旭:2024 现代应用开发关键趋势——降低成本、简化架构

TiDB 社区干货传送门

数据库前沿趋势

专为大模型训练优化,百度集合通信库 BCCL 万卡集群快速定位故障

Baidu AICLOUD

故障定位 大模型训练 集合通信库 NCCL

DAPP合约代币矩阵公排系统开发

l8l259l3365

TIKV 分布式事务--加锁的 KEY 是什么

TiDB 社区干货传送门

TiDB 底层架构 TiDB 源码解读

QPS 提升 10 倍!滴滴借助 StarRocks 物化视图实现低成本精确去重

StarRocks

数据库 数据仓库 数据分析

2024年工控人职场求生之路

AIRIOT

工控 智慧系统 工控工程师

【FAQ】HarmonyOS SDK 闭源开放能力 —Push Kit

HarmonyOS SDK

HarmonyOS

立即报名Atlassian Team’24,与龙智一同踏上前往数字服务的创新之路

龙智—DevSecOps解决方案

Atlassian

TiDB PLAN REPLAYER 功能使用实践

TiDB 社区干货传送门

6.x 实践

一站式数据库上云迁移、同步与集成平台 DTS 的设计实践

Baidu AICLOUD

数据库迁移 数据库集成

如何做代币分析:以 LEO 币为例

Footprint Analytics

blockchain Token

VMware ESXi 8.0U2b 发布下载 - Broadcom VMware 首次重大更新

sysin

云计算 虚拟化 esxi

NFTScan NFT API 在 Web3 钱包追踪器上的开发应用

NFT Research

NFT NFTScan API】

熟悉TiDB运维管理工具之TiUP(二)

TiDB 社区干货传送门

管理与运维

TIDB全量+实时增量备份(实现恢复数据库到指定时间点)

TiDB 社区干货传送门

数据库架构设计

Digg与Reddit加入NoSQL阵营_架构_Abel Avram_InfoQ精选文章