写点什么

一致性与可用性:Werner Vogels 谈最终一致性

  • 2008-01-17
  • 本文字数:2019 字

    阅读完需:约 7 分钟

直到 90 年代中期,当谈到数据复制的时候,分布的透明性和数据的一致性常常都是重要的工作目标。随着大型 Internet 系统开始崛起,可用性(availability)也成了另一项重要的考虑因素。 Eric Brewer 提出的 CAP 定理说,“在数据共享的系统的三项属性当中,数据一致性、系统可用性和对网络分区的耐受性,在任何给定时间内都只能达成其中的两项”。由于“在较大分布规模的系统中,网络分区是给定的”,因此一致性和可用性必有一项需要放宽。

在此前提下,最终一致性(eventual consistency)的概念开始赢得关注。与他在 QCon London 2007 上的演讲一脉相承,Werner Vogels 最近在博客上总结了一些与大规模数据复制及一致性需求相关的原则、抽象和权衡

他强调说一致性并不是绝对优先考虑的事:

不一致是可以容忍的,这有两个理由:一是可以在高并发条件下提高读写性能;二是处理一些分区状况——多数决模型(majority model)有可能使系统的一部分表现为不可用,虽然那些节点正运行良好。

不一致是否可接受取决于客户应用程序。Vogels 给出了一个网站的例子,例中真正重要的是“用户感知到的一致性”,也就是让不一致窗口——即“更新发生时刻到任何观察者都一定能观察到更新后数据的时刻之间的时间段”——“小于顾客对下一页面加载时间的期待”,这样更新就可在预期发生下一次读取的时刻之前传播到整个系统。

如果换成更浅显的语言,Vogels 说,“看待一致性有两种角度”:

一种是从开发者 / 客户端的角度;他们如何观察数据更新。第二种是从服务器的角度;更新如何流经整个系统,系统对更新有何保证。

在客户端,Vogels 列举了四个角色:一个被观察者看作是“黑盒”的存储系统,而观察者由三个进程来扮演:“进程 A[……] 对存储系统进行读写”,“进程 B 和进程 C[……] 独立于进程 A,它们也读写存储系统”。这些进程是“独立的,并且需要相互通信以共享信息。”客户端一致性就在于“一个观察者(在此即进程 A、B 或 C)如何以及何时看到存储系统中的一个数据对象被更新。”

一致性有不同程度:

  • 强一致性。在更新完成后,(A、B 或 C 进行的)任何后续访问都将返回更新过的值。
  • 弱一致性。系统不保证后续访问将返回更新过的值,在那之前要先满足若干条件。通常条件就是经过一段时间,也就是不一致窗口
  • 最终一致性。存储系统保证如果对象没有新的更新,最终(在不一致窗口关闭之后)所有访问都将返回最后更新的值。

Vogels 还概要说明了最终一致性模型的各种变体:

  • 因果一致性。如果进程 A 通知进程 B 它已更新了一个数据项,那么进程 B 的后续访问将返回更新后的值,且一次写入将保证取代前一次写入。与进程 A 无因果关系的进程 C 的访问遵守一般的最终一致性规则。
  • “读己之所写(read-your-writes)”一致性。这是一个重要的模型。当进程 A 自己更新一个数据项之后,它总是访问到更新过的值,绝不会看到旧值。这是因果一致性模型的一个特例。
  • 会话(Session)一致性。这是上一个模型的实用版本,它把访问存储系统的进程放到会话的上下文中。只要会话还存在,系统就保证“读己之所写”一致性。如果由于某些失败情形令会话终止,就要建立新的会话,而且系统的保证不会延续到新的会话。
  • 单调(Monotonic)读一致性。如果进程已经看到过数据对象的某个值,那么任何后续访问都不会返回在那个值之前的值。
  • 单调写一致性。系统保证来自同一个进程的写操作顺序执行。要是系统不能保证这种程度的一致性,就非常难以编程了。

在服务器端,关注的是如何达到一致性和可用性的程度要求。Vogels 举出了各种场景,其中“N 是保存数据副本的节点数量,W 是在更新完成之前需要确认收到更新的副本数量,R 是当通过一次读操作访问一个数据对象时要联系的副本数量”。

如果 W+R > N,那么写集合与读结合总是重叠的,那么我们可以保证强一致性。[……] 这种遵循简单的法定人数规则(basic quorum protocols)的安排方法,其问题是当系统由于某种失败而不能写入到 W 个节点时,写操作就必须失败,使系统不可用。

[…]

当 R=1 且 N=W,对读操作是最优的。当 W=1 且 R=N,这样的优化可以得到非常快速的写操作。当然在后一例中,要是存在失败就保证不了了;而且如果 W < (N+1)/2 有可能出现写冲突,因为写集合没有重叠。

当 W+R <= N 就会出现弱一致性 / 最终一致性,即读集合与写集合没有重叠。如果故意要这么安排,又不是出于某种失败情形的考虑,那么只有把 R 设为 1 才是合理的。

[…]

如果 W+R <= N,那么系统就存在缺陷,有可能从未收到更新的节点读取数据。

“读己之所写”一致性、会话一致性和单调一致性是否可以达成,取决于客户端对为其执行分布式协议的服务器的“粘度”。如果每次都是同一台服务器,那么就比较容易保证“读己之所写”一致性和单调一致性。这样做会使管理负载平衡以及容错变得稍困难一些,但这是一种简单的方案。使用会话可使意图更加明确,且为客户端提供了适当的推理基础。

查看英文原文: Consistency vs. availability: eventual consistency by Werner Vogels

2008-01-17 19:586783
用户头像

发布了 225 篇内容, 共 74.1 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

人工智能、GPU与云计算的关系和应用

青椒云云电脑

人工智能 GPU算力 AI绘画

GPU云服务器有什么优势?

青椒云云电脑

GPU云桌面

矩阵起源荣获上海科技创新资金计划项目立项资助

MatrixOrigin

数据库 云原生 HTAP MatrixOrigin MatrixOne

昇腾AI开发者创享日暨昇腾AI创新大赛2023大连区域赛成功举办

彭飞

九章云极DataCanvas公司智算中心正式落地

九章云极DataCanvas

Vulkan并发机制

江湖修行

android 前端 opengl 渲染 vulkan

交易日均千万订单的存储架构设计与实践 | 京东物流技术团队

京东科技开发者

架构设计 订单系统 存储架构 企业号9月PK榜

为什么GPU在深度学习扮演重要角色?

青椒云云电脑

gpu

怎么选择适合深度学习的GPU

青椒云云电脑

云桌面 AI绘画 云桌面系统

第2期 | 破局 全球项目、精智核算

用友BIP

项目管理

规模化、可复制的大模型应用——企业知识管家

九章云极DataCanvas

第六周作业

大肚皮狒狒

后端服务之应用预热 | 京东云技术团队

京东科技开发者

JS防抖 抖动 jsf 企业号9月PK榜 应用预热

九章云极DataCanvas公司入选人工智能融合发展与安全应用典型案例

九章云极DataCanvas

一个 println 竟然比 volatile 还好使? | 京东云技术团队

京东科技开发者

volatile JIT 企业号9月PK榜 println

研究了代码质量后,开发效率提升10倍,bug减少20倍!!

飞算JavaAI开发助手

一文浅谈Mockito使用 | 京东云技术团队

京东科技开发者

测试 Mockito Mock 企业号9月PK榜

可观测性成熟度模型介绍(一)

乘云数字DataBuff

支付宝小程序云,智能开放的增长引擎

TRaaS

支付宝小程序 AI 大模型

GPU应用:从计算机图形学到人工智能

青椒云云电脑

人工智能 gpu AI绘画

集成开发环境(IDE)的用途?

小齐写代码

集成销售和收入计划,打造企业内部的协作共赢

智达方通

数据分析 智达方通 优化流程

矩阵起源荣获"2023大数据助力工业经济"年度创新产品

MatrixOrigin

数据库 云原生 HTAP MatrixOrigin MatrixOne

华为云ROMA Connect行业生态联盟成立,携手共建行业软件合作新生态

云计算 华为云 应用与数据集成

DeFi/DApp单双币/子母币流动性质押LP挖矿项目系统开发

l8l259l3365

Python Web框架

人工智能的催化剂:GPU高性能计算

青椒云云电脑

人工智能 gpu GPU算力 AI绘画

一致性与可用性:Werner Vogels谈最终一致性_架构_Sadek Drobi_InfoQ精选文章