写点什么

GitHub 使用 Spokes 进行跨数据中心复制

  • 2017-10-23
  • 本文字数:875 字

    阅读完需:约 3 分钟

来自 GitHub 的基础设施工程师 Micheal Haggerty 发表了一篇博文,解释他们是如何使用 Spokes 进行跨数据中心复制的。包括如何减少网络往返次数、引入三阶段提交、优化参考更新的性能以及其他各种调优。

Haggerty 解释说,GitHub 通过跨数据中心复制代码仓库来最大化弹性和降低延迟。一旦数据中心发生故障,需要由另一个区域的副本接替工作,为了得到最好的性能,需要为用户提供距离最近的副本。

Spokes 用于复制用户的代码仓库,确保代码仓库之间是同步的。它就像代理一样,在应用层面透明地执行复制任务。Haggerty 说,以前只有距离很近的代码仓库之间才能进行复制作业,后来通过降低延迟和优化参考更新性能等方式解决了这个问题。

之前在进行复制时延迟会不断增加,阻碍了 Spokes 进行参考更新的速度。虽然这对大多数用户来说并不是大问题,但有些 Git 工作流在这方面有很高的要求:

大部分用户不会经常提交代码,但 GitHub 托管着将近 7000 万个代码仓库,有些用户的工作流你根本无法预测到。我们努力让 GitHub 能够应付所以场景,也非常关注一些极端情况。

Haggerty 也解释了 GitHub 内部是如何处理参考更新的。GitHub 基于内部的测试来决定是否合并或 rebase 一个 PR。如果某个分支有多个 PR,每个 PR 都需要通过测试。

减少网络往返次数可以有效降低延迟。GitHub 使用三阶段提交协议来更新副本,同时使用分布式锁来保证更新次序。不过这样需要四个网络往返,成本有点高。他们也在努力确保在等待网络调用结束之前先完成其他的任务。

GitHub 的工程师也参与了 Git 项目,包括处理参考更新的事务机制,该机制基于副本是否有能力执行参考更新来决定是提交还是回滚事务。还有其他一些与参考更新操作相关的改进。

Spokes 使用自定义的校验和来比较副本,如果校验和相同,说明它们包含相同的内容。校验和是通过增量的方式算出来的,并不是每次都从头开始算。

内务(book keep)操作被合并到少量的事务当中,因为有些单次提交操作会造成数百次内务更新,需要耗费三分之一秒的时间。

点击链接阅读博客全文,了解更多细节。

查看英文原文 How GitHub Uses Spokes for Cross Data-Center Replication

2017-10-23 19:001680
用户头像

发布了 322 篇内容, 共 142.2 次阅读, 收获喜欢 147 次。

关注

评论

发布
暂无评论
发现更多内容

JVM原理与实战

东哥

没有一个冬天不会过去!疫情当下,企业“逆势而上”必选“上云”跑道

华为云开发者联盟

云计算 新基建 华为云 企业上云 云服务器

学习python(嵩天老师的课)

Geek_2a27b0

2020年运维行业学啥技术比较值钱?

EUSCE

DevOps 运维 运维自动化 系统运维 linux运维

没想到,Git居然有3种“后悔药”!

Geek Tech

git git reset

图解JavaScript——进阶篇(执行上下文、变量对象、作用域、作用域链、闭包、this、原型及原型链、事件循环等一把梭)

执鸢者

Java 大前端 函数执行 事件循环

要老婆吗? AR一键生成的那种

程序员生活志

linux入门系列10--firewalld防火墙管理

黑马腾云

Linux centos 防火墙 linux运维 linux防火墙

MySQL-技术专题-分区表和合并表详解

洛神灬殇

linux入门系列9--用户管理及文件权限控制

黑马腾云

Linux centos centos7 linux运维 linux用户权限

B站抽奖

・ 懒ヾ

英伟达收购ARM:双赢还是灾难?

脑极体

jQuery笔记

一个坚强的小怪兽

jquery

SkyWalking为超大规模而生

热心的朝阳群众

Skywalking 开源社区

威联通(NAS)应用篇:搭建个人音乐中心

BigYoung

NAS QNAP 音乐 搭建 无损

SSH免密登录

Radix10

Linux Shell 加密 openssh SSH

linux入门系列8--shell编程入门

黑马腾云

Linux centos Shell linux命令 linux编程

学习笔记

Qx

学习

《精益产品开发》随笔

研发管理Jojo

敏捷开发 精益思想 敏捷教练

你的面向接口编程一定对吗?

架构师修行之路

内容审核平台助力猫爪构建健康安全的社交环境

百度大脑

人工智能 百度 百度大脑 内容审核

为什么Mysql索引非得是B+树

知方可达

MySQL

你用对锁了吗?浅谈 Java “锁” 事

yes

Java 多线程与高并发

如何查看Django ORM执行的SQL语句

BigYoung

sql django ORM 查询

两分钟给你讲清楚JavaScript中的闭包与this

在沉默中

Java 闭包

深度学习框架“国货”正当时,但要警惕无差别投入的“产业陷阱”

脑极体

35岁大厂程序员被劝退!老板说:没年轻人有冲劲!真有内味了吗?

程序员生活志

程序员 职场

区块链的想象,解决贫富差距

CECBC

区块链 货币 股市

推荐几个实用的前端编辑工具VSCode插件,让你开发事半功倍,告别加班烦恼

web前端程序猿

vscode 大前端 工具软件

深化产教融合,共育数字人才

InfoQ_967a83c6d0d7

《八佰》,电影的价值已在真实之外

zhoo299

随笔杂谈 电影

GitHub使用Spokes进行跨数据中心复制_GitHub_Andrew Morgan_InfoQ精选文章