NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

GitHub 使用 Spokes 进行跨数据中心复制

  • 2017-10-23
  • 本文字数:875 字

    阅读完需:约 3 分钟

来自 GitHub 的基础设施工程师 Micheal Haggerty 发表了一篇博文,解释他们是如何使用 Spokes 进行跨数据中心复制的。包括如何减少网络往返次数、引入三阶段提交、优化参考更新的性能以及其他各种调优。

Haggerty 解释说,GitHub 通过跨数据中心复制代码仓库来最大化弹性和降低延迟。一旦数据中心发生故障,需要由另一个区域的副本接替工作,为了得到最好的性能,需要为用户提供距离最近的副本。

Spokes 用于复制用户的代码仓库,确保代码仓库之间是同步的。它就像代理一样,在应用层面透明地执行复制任务。Haggerty 说,以前只有距离很近的代码仓库之间才能进行复制作业,后来通过降低延迟和优化参考更新性能等方式解决了这个问题。

之前在进行复制时延迟会不断增加,阻碍了 Spokes 进行参考更新的速度。虽然这对大多数用户来说并不是大问题,但有些 Git 工作流在这方面有很高的要求:

大部分用户不会经常提交代码,但 GitHub 托管着将近 7000 万个代码仓库,有些用户的工作流你根本无法预测到。我们努力让 GitHub 能够应付所以场景,也非常关注一些极端情况。

Haggerty 也解释了 GitHub 内部是如何处理参考更新的。GitHub 基于内部的测试来决定是否合并或 rebase 一个 PR。如果某个分支有多个 PR,每个 PR 都需要通过测试。

减少网络往返次数可以有效降低延迟。GitHub 使用三阶段提交协议来更新副本,同时使用分布式锁来保证更新次序。不过这样需要四个网络往返,成本有点高。他们也在努力确保在等待网络调用结束之前先完成其他的任务。

GitHub 的工程师也参与了 Git 项目,包括处理参考更新的事务机制,该机制基于副本是否有能力执行参考更新来决定是提交还是回滚事务。还有其他一些与参考更新操作相关的改进。

Spokes 使用自定义的校验和来比较副本,如果校验和相同,说明它们包含相同的内容。校验和是通过增量的方式算出来的,并不是每次都从头开始算。

内务(book keep)操作被合并到少量的事务当中,因为有些单次提交操作会造成数百次内务更新,需要耗费三分之一秒的时间。

点击链接阅读博客全文,了解更多细节。

查看英文原文 How GitHub Uses Spokes for Cross Data-Center Replication

2017-10-23 19:001512
用户头像

发布了 322 篇内容, 共 134.4 次阅读, 收获喜欢 144 次。

关注

评论

发布
暂无评论
发现更多内容

我写了一本操作系统词典送给你

cxuan

操作系统 计算机

奈学:数据湖和数据仓库的区别有哪些?

奈学教育

数据仓库 数据湖

读闲书自由和财务自由

池建强

读书 财务自由

游戏夜读 | 游戏关卡设计师

game1night

架构师训练营第四周课后作业

竹森先生

极客时间 极客大学架构师训练营

第四章总结

架构师训练营第 4 周作业

在野

极客大学架构师训练营

奈学:数据湖有哪些缺点?

奈学教育

数据湖

创新管理体系标准ISO56002介绍

涛哥 数字产品和业务架构

数字化转型 创新

如何成为一名合格的 C/C++ 开发者?

张小方

c++ Linux 编程语言 后端 架构设计

架构演化

满山李子

动态规划算法重点在于找上一个的公式,Google Code Review,John 易筋 ARTS 打卡 Week 06

John(易筋)

ARTS 打卡计划

计算机操作系统基础(五)---Linux的进程管理

书旅

php 线程 多线程 操作系统 进程

奈学:数据湖和数据仓库的区别有哪些?

古月木易

数据仓库 数据湖

谈谈架构和微服务<一>

Gabriel

架构 微服务 领域驱动设计 软件设计

SpringBatch系列之Remote-Chunking

稻草鸟人

大数据 Spring Boot SpringBatch 批量任务

架构师训练营第 4 周——学习总结

在野

极客大学架构师训练营

大型互联网应用系统使用技术方案和手段

极客大学架构师训练营第四周学习总结

竹森先生

极客大学 极客大学架构师训练营

如何进行高效学习

淡蓝色

深度思考 方法论 感悟 随笔杂谈

典型的大型互联网应用系统

Z冰红茶

大型互联网架构与集群技术

cxy

深入理解Kubernetes的Service:回归本源的场景需求

韩超

Kubernetes 微服务 服务

嗨,兄弟,别担心,这年头谁还没有一点焦虑!

周果

程序员 管理 成长 个人感想

ARTS 打卡 Week 05

teoking

奈学:数据湖有哪些缺点?

古月木易

数据湖

轻松上手promise原理(2):then的简单实现

前端小帅

如何学 Java,我说点不太一样的学习方式

四猿外

学习 程序员 个人成长

实现简单的"纤程"

Near

聊一聊程序员如何增加收入

张小方

程序员 互联网 面试 副业赚钱 薪资

MySQL 实战 45 讲笔记(2)-查询优化

程序员老王

MySQL

GitHub使用Spokes进行跨数据中心复制_GitHub_Andrew Morgan_InfoQ精选文章