写点什么

Flickr 选择使用 Sentinel 来保证 Redis 的高可用性

  • 2014-08-19
  • 本文字数:1043 字

    阅读完需:约 3 分钟

Flickr 近期宣布,针对他们的线下任务处理子系统中的 Redis ,已经部署了 Sentinel ,用于自动化其故障转移操作。但他们对 Redis 的一致性问题感到了担忧。

去年, Factual 的工程师及分布式系统专家 Kyle Kingsbury ,对 Redis 的一致性问题进行了研究,并将结果发表在了他的 Jespen 系列连载中。在文章中,他表示能够使用 Redis 和 Sentinel 构造出这样一个场景:在 Redis 通知我们已成功的写请求中,有 56% 的写请求事实上是被丢弃了。Kingbury 表示,这个令人担心的结果是由 Sentinel 系统中的两个问题导致的。

第一个问题,要注意在网络分割开始时,所有客户端都会丢失写请求的数据。因为当网络出现故障时,客户端都往 n1 节点写数据。由于之后 n1 退级,不再是主节点,在这个时间窗口内写入的数据将全部丢失。第二个问题是由 split-brain 引起的:在网络分割现象消失之前,n1 和 n5 都成为了主节点。一些客户端可能可以成功地写入数据,而其他的将丢失所写的数据,这取决于客户端与哪个节点进行交互。

Redis 的作者 Salvatore Sanfilippo 对这篇文章作出了回复。他确认了这个问题的存在,但也同时指出:丢失数据量最小化并不是 Sentinel 的设计目标。

需要明确的是,这条指责是正确的。它表明了 Sentinel 并不擅长处理在网络分割中将丢失数据量最小化这个复杂的问题,这一点原本就不是 Sentinel 的设计目标。况且,在用户通过自己所写的脚本来处理故障转移的案例中,99% 的案例在故障检测和故障转移处理过程上,远远逊于 Sentinel。

尽管 Flickr 知道这些问题,但由于起初他们为自己的线下任务处理子系统制定了过于自信的 SLA 目标,他们开始转而使用 Sentinel。在注意到他们的手动故障恢复流程不可能帮助他们达到 99.995% 正常运行时间的目标后,他们寻找了其他解决方案,并选定了 Sentinel。

在对 Sentinel 系统及它的配置参数进行重要的测试之后,他们能设计出一种在 4~6 秒钟内自动进行故障转移的方法。从而使得他们可以达到之前设定的正常运行时间的目标。在测试过程中,他们也能重现 Kingsbury 所发现的场景。但是,Flickr 工程师 Richard Thorn 和 Shawn Cook 解释道:“尽管我们相信我们的生产环境会受到 split-brain 的影响,但我们确信所获得的好处远大于带来的风险”。

参考英文原文: Flickr Chooses Sentinel for Highly Available Redis


感谢邵思华对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-08-19 04:093498

评论

发布
暂无评论
发现更多内容

硬核解读KubeEdge基于大模型边云协同的机器人语义分割算法

华为云开发者联盟

开源 华为云 大模型 华为云开发者联盟 企业号2024年6月PK榜

人工智能 | 大模型之提示词工程:零样本提示

测吧(北京)科技有限公司

测试

服务网格自动故障检测及流量切换方案

天翼云开发者社区

云计算 微服务 云原生 容器技术 服务网格

全面升级,票据识别新纪元:合合信息TextIn多票识别2.0

合合技术团队

人工智能 OCR 发票识别

Go Modules:Go语言依赖管理的新篇章

左诗右码

多链代币开发:打造跨链互操作性的新纪元

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

拼多多API:轻松掌握商品详情的艺术

Noah

Dapp系统开发:从需求定制到源码交付的一站式解决方案

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

NumPy的深浅拷贝的区别与选择

我再BUG界嘎嘎乱杀

Python Numpy 深浅拷贝

Airtest脚本的重构与优化:提升测试效率和可读性

我再BUG界嘎嘎乱杀

Python 性能优化 测试 自动化测试 Airtest

StarRocks x 腾讯视频:指标中台驱动湖仓一体建设实践

StarRocks

数据库 大数据 数据湖 湖仓一体 指标平台

数字藏品NFT链游开发:快速上线定制开发的最佳选择

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

TON链代币开发:探索区块链的新前沿

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

豆瓣评分9.6!用81个项目带你从Python 3零基础到Python自动化

我再BUG界嘎嘎乱杀

Python 编程 入门 开发语言 零基础

TASKCTL技术前沿: Docker容器数据卷的高级配置 —— 统一任务调度平台的策略优化

敏捷调度TASKCTL

TASKCTL Docker 镜像

iPaaS中API接口管理平台的作用

谷云科技RestCloud

API API接口 ipaas

ETL驱动企业集成转型与数据集成创新

谷云科技RestCloud

ETL 数据集成 ETLCloud

“翼”鸣惊人 天翼云两篇论文被ACM ICPP 2024收录

极客天地

一文了解Spark引擎的优势及应用场景

不在线第一只蜗牛

大数据 spark 分布式

元宇宙链游APP开发专属平台:开启虚拟世界新纪元

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

上周面了百度,问的很细~

王磊

Java 面试

淘宝/天猫商品详情API接口在电商智能决策支持系统中的作用与实现

技术冰糖葫芦

api 网关 API Explorer API 文档 pinduoduo API

Flickr选择使用Sentinel来保证Redis的高可用性_语言 & 开发_Benjamin Darfler_InfoQ精选文章