2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Digg 与 Reddit 加入 NoSQL 阵营

  • 2010-03-25
  • 本文字数:1571 字

    阅读完需:约 5 分钟

Digg 和 Reddit 在这个月都宣布了将转向 Cassandra ,因为 MySQL 对他们来说伸缩性不够了。一些人认为 MySQL+memchche 不再是事实上的伸缩解决方案了。

Digg 在去年九月宣布了他们转向 Cassandra 的计划,而这一过程在这个月完成了。仔细比对了其它项目——HBase,Hypertable,Tokyo Cabinet/Tyrant,Voldemort,以及 Dynomite——,他们最终选择了 Cassandra,出于以下的考虑:

每个系统都有它自己的强项和弱项,但是 Cassandra 综合了各个方面。它提供了面向列的数据存储,因此这相比纯粹的 key/value 存储又更结构化一些。它通过分布式高可用的点对点集群来运作。尽管目前它的核心功能还有一些欠缺,但相较于其它方案而言,它更接近我们想要的。

Digg 几乎重建了整个基础设施,跳出了 LAMP 栈。主要的起因是 MySQL,如同任何其它的 SQL 数据库一样,它是为读取而作的优化,而不能很好的处理写入:

我们不再使用用 MySQL 的主要动机,是因为要在一个快速增长看不到头的数据集上,构建一个高性能密集写入的应用越来越困难了。这种增长迫使我们使用水平和垂直的分区策略,这就消除了关系型数据所带来的大部分价值了,同时仍然会产生各种开销…

随着我们系统的扩张,跨越多个数据中心的冗余,网络性能,以及增加容量和无宕机时间的更换失效节点对我们来说就尤为重要。我们计划继续使用廉价硬件,并假设失效是平常的。这些都为 MySQL 增加了难度。

另一个网站,Reddit,曾经出现过 memcacheDB 相关的问题,一开始他们通过增加更多的 RAM 来处理,但他们需要一个长久的解决方案是再明显不过的。他们在十天之内完成了向Cassandra 的转换,在Cassandra 开发者和社区的帮助以及EC2 在测试和部署Cassandra 的实例方面的支持下,只用了一名开发者就做到了。

因为许多重要的网站,比如Facebook 或Twitter,都已经在使用或者计划迁移到Cassandra,一些人声称 MySQL+memcached 作为事实的伸缩性解决方案的时代结束了。Todd Hoff 并不认为 MySQL 将会在即将来到的某个时间消失,但它不会再代表首位的解决方案:

从一个小的角度来看,很清楚 MySQL+memcached 的时代已经过去了。它会坚持一段时间。旧的技术很少完全的消失。一些人仍在骑马。一些人还在使用 CD。而因特网也不会完全取代电视这种古老的电磁广播技术,但大多数将会奔向一个新的时代…

我们很清楚 MySQL+memcached 背后的许多思想都是说到了点子上的,这些都在新的系统里得到了保留,只是它的实现显得有点笨重。开发者参与进来,铺平了缺口,磨掉了棱角,创建了一个新的强健的平台,其本身成为了新生态系统和新时代的根基。

对于 Hoff 所说的"很清楚 MySQL+memcached 的时代已经过去了",Mark Atwood 表示不同的意见,他认为 memcached 仍将会长期得到应用

memcached 作为实现伸缩速度的前沿技术这一时代或许"过去"了,但这并不是因为 memcached 失败,而是因为另外的技术 (并不是替代,而是补充) 正在涌现…

但这不会是 memcached 的终结。可以说,这一高性能的 key-value 存储仍将是一个有用的构建模块,不管是对于其自身,还是作为其它的技术组件的子组件。

我肯定 memcache 将会继续演化。将会有更多的实现,更多的局限将会被移除,将会有更多的管理工具,还有更多的系统加上 memcached 的网络协议,而一些 ORMs 框架在构建时就会假设 memcached 可用,将会有协议方面的特性以及在共享托管和云环境方面的实现。

Hoff 后来在他文章的评论中又说到:“我并不是想说缓存将会消失或者 MySQL 将会消失。我坚定的相信内存将是新的硬盘这一概念…所过去了的是 MySQL 与 memcached,相辅相成的,作为开发可伸缩系统的默认平台。”

尽管 MySQL 与 memcache 仍将会是伸缩性问题的良好解决方案,但已经有新的 non-SQL 方案产生了,而它们看起来能为超大规模的系统带来更好的结果。

查看英文原文: Digg and Reddit Have Joined the NoSQL Camp

2010-03-25 07:584316
用户头像

发布了 133 篇内容, 共 43.9 次阅读, 收获喜欢 1 次。

关注

评论

发布
暂无评论
发现更多内容

2021年4季度全国网络零售发展指数同比增长0.6%

易观分析

网络零售

封装业务流程,解决复杂重复的审批流程配置

明道云

父亲节特辑丨童年经典蓝精灵之百变蓝爸爸数字藏品,限量发售!

百度开发者中心

8种桌面IDE CodeArts智能代码补全类型

华为云开发者联盟

云计算 代码 华为云

对讲功能在远程办公中的应用 | 社区征文

Changing Lin

初夏征文

云原生多云管理利器 -- cluster-api 之 ControlPlane

Daocloud 道客

Kubernetes 云原生 多云管理 cluster-api ControlPlane

异步容灾,AntDB的业务不间断数据恢复方案

亚信AntDB数据库

数据库 高可用 容灾 数据恢复

A/B测试助力游戏业务增长

字节跳动数据平台

游戏开发 游戏 ab测试 游戏运营

2022华为全球校园AI算法精英大赛即将升级启航,等你来战,开拓未来边界

最新动态

毕业回馈!Apache Doris 社区所有贡献者来领礼品啦!

SelectDB

数据库 数据湖 开源项目 apache doris 社区活动

AIOps落地五大原则(二):价值路线

BizSeer必示科技

轻松实现微信滑动返回页面效果 | 社区征文

Changing Lin

android 安卓 自定义view 初夏征文

数商云X日本高化学,共同打造跨境化学品B2B平台新范式

数商云

数字化转型 b2b

解密抖音春节红包背后的技术设计与实践

JackJiang

架构设计 短视频 社交产品

CRM快速开发平台:破解管理困局

力软低代码开发平台

前后端如何并行开发,云端mock了解一下

Liam

前端 前端开发 Mock Mock 服务 前端工具

如何把企业内部碎片信息系统化?

小炮

多任务视频推荐方案,百度工程师实战经验分享

百度开发者中心

云上弹性高性能计算,支持生命科学产业高速发展、降本增效

阿里云弹性计算

HPC 高性能计算 生命科学 药物设计

覆盖接入2w+交通监测设备,EMQ为深圳市打造交通全要素数字化新引擎

EMQ映云科技

物联网 IoT 智慧交通 实践案例 6月月更

我的远程办公经验 | 社区征文

坚果

初夏征文

2022淘宝天猫618背后的技术秘密

阿里巴巴大淘宝技术

LP流动性质押挖矿分红dapp系统开发合约定制

开发微hkkf5566

钱大妈基于 Flink 的实时风控实践

Apache Flink

大数据 flink 编程 流计算 实时计算

重新认识WorkPlus,不止IM即时通讯,是企业移动应用管理专家

BeeWorks

链上智能合约Dapp系统开发部署搭建

薇電13242772558

区块链 智能合约

从华为WeAutomate数字机器人论坛,看政企领域的“政务新智理”

王吉伟频道

RPA 数字化转型 华为WeAutomate 政务新智理 数字政府

客户案例|观测云助力合思信息升级新一代可观测平台

观测云

自适应批作业调度器:为 Flink 批作业自动推导并行度

Apache Flink

大数据 flink 编程 流计算 实时计算

东方甄选双语直播火爆出圈,新东方转型初见端倪

易观分析

农业发展

力扣每日一练之数组中篇Day2

京与旧铺

6月月更

Digg与Reddit加入NoSQL阵营_架构_Abel Avram_InfoQ精选文章