写点什么

GitHub 的 DGit 改进了平台的可靠性、性能以及可用性

  • 2016-04-10
  • 本文字数:1294 字

    阅读完需:约 4 分钟

GitHub 最近悄悄地发布了 DGit,全称为“分布式 Git”。这是一种基于 Git 创建的分布式存储系统,其目标是改进使用 GitHub 时的可靠性、可用性以及性能。

DGit 是一个应用层面的协议,它利用了 Git 分布式的特性,将每个仓库在三台不同的、独立选择的服务器上保留三个备份。按 GitHub 所说,这个简单的架构在可靠性、可用性和性能方面带来了许多直接的好处。

  • 考虑到托管某个仓库的三台服务器是互相独立的,那么他们同时变得不可用的可能性非常低。
  • 用户的请求可在这三台服务器之间进行负载均衡处理,由于这些请求大部分是读请求,因此可以立即响应,而无需在这三台服务器之间进行同步,这将带来直接的、接近于 3 倍的性能提升。
  • 多个仓库之间出现“命运共享”(fate sharing)的情况大大减少了。命运共享这种情况会造成一个或多个仓库的性能下降,其原由是这些仓库与另其他非常流行的或者过于庞大的仓库共享了相同的服务器。在 DGit 的实现中,由于这些仓库在独立的服务器中进行分发,因此这种情况同时发生在三台服务器上的可能性少之又少。这也使某个请求可以在负载相对较小的服务器中进行处理。
  • 分发服务器之间无需保持一个很近的距离,他们可以分布在不同的可用区域或是数据中心之间。这种方式显然能够改进可用性,并且对于在地理位置上更接近的用户也能够带来性能上的改进。

DGit 使 GitHub 能够废除之前所使用的基于备份的模式(由于 DGit 的发布过程还在进行中,因此目前仍在使用这一模式)。对于每个活动的服务器来说,这种模式要求设置一个专用的备用服务器,以交叉线连接,数据将通过 DRDB 进行同步。

对于 GitHub 的整体功能来说,废除这种模式能够带来一些额外的好处:

  • 当某一台服务器发生故障时,唯一必须要做的一件事就是将等待中的请求重新路由至一台新的服务器,并重启发生故障的服务器。
  • 此外,替换一台有故障的服务器变得不再那么紧迫了,因为至少还有两台服务器能够运行,他们可将数据迅速地分发至第三台服务器。
  • 由于新的方式不再需要使用一台专用的备用服务,这意味着 GitHub 能够更好地利用每个 CPU 以及所有的可用内存,以处理用户的请求。
  • DGit 极大地简化了 GitHub 基础设施的管理,例如添加新的服务器、应对某些仓库变得非常庞大或非常流行等情况。

正如之前所说,DGit 是基于 Git 本身所打造的,它并没有利用 RAID、DRBD 或其他分发技术。GitHub 选择实现自己的算法,以处理序列化、加锁、故障检测以及重新分发等操作。在与 InfoQ 的一次对话中,GitHub 表示他们使用了三阶段提交(3PC)协议以处理分布式事务。“DGit 基本已经消除了在Git 层由于单一托管或整个机架不可用所造成的服务故障”。

如上文所说,GitHub 近几个月来正在逐步部署DGit,首先从他们自己的仓库开始部署。当他们对于新的系统具备了充分的信心之后,就会开始迁移受欢迎的公共仓库。在今年二月,GitHub 开始批量地迁移仓库。目前大约有60% 的仓库、98% 的Gist,总计约67% 的GitHub 数据已经运行在DGit 上了。GitHub 向InfoQ 表示:“我们正在日夜不停地通过导入作业将数据从之前的存储架构中迁移至DGit”。

查看英文原文 GitHub’s DGit Improves Reliability, Performance, and Availability

2016-04-10 19:002259
用户头像

发布了 428 篇内容, 共 189.5 次阅读, 收获喜欢 39 次。

关注

评论

发布
暂无评论
发现更多内容

大数据平台Bug Bash大扫除最佳实践

京东科技开发者

面向Java应用网络流的非侵入可观测指标采集联合方案 – Sermant & Gopher

华为云开源

微服务 Java、 sermant

报名启动|OpenHarmony源码转换器—多线程特性转换赛题

OpenHarmony开发者

OpenHarmony

多功能矢量图编辑器:Boxy SVG最新激活版

胖墩儿不胖y

Mac软件 矢量图编辑器 矢量图编辑

DAPP算力挖矿系统开发丨详情开发

l8l259l3365

京东店铺所有商品数据接口(JD.item_search_shop)丨京东API接口

tbapi

京东API接口 京东商品数据接口 京东店铺所有商品数据接口 京东店铺数据接口

自主研发国产堡垒机,助力企业信息安全可控

行云管家

网络安全 信息安全 堡垒机

软件测试训练营|从原理到实战,四天带你轻松进阶Python

霍格沃兹测试开发学社

基于扁平化BOM的全业务应用领先实践,提升离散制造行业运营效率

用友BIP

智能制造

TDD、BDD、ATDD都是什么、有什么区别?(下)

禅道项目管理

TDD 自动化测试 BDD ATDD

华为云分布式云原生UCS,助力MetaERP构建企业级高可用分布式业务

华为云开发者联盟

云原生 华为云 华为云开发者联盟

Databend 开源周报第 126 期

Databend

Data

国内用户怎么申请Fomepay虚拟卡,支持ChatGPT、Facebook、亚马逊、google play、Apple id、奈飞

跨境

Google Cloud 亚马逊 openai ChatGPT 奈飞客户端

基于AIoT物联平台的设备预防型维护助力光伏单晶行业实现设备精准维护!

用友BIP

资产管理 光伏单晶行业

开源协助平台工程灵活应对多云时代的挑战

SEAL安全

开源 运维 平台工程

京东sku属性数据接口(JD.item_sku)丨京东API接口

tbapi

京东API接口 京东商品数据接口 京东商品sku信息接口 京东商品属性接口 京东API

使用 KubeSphere 与极狐GitLab 打造云原生持续交付系统

极狐GitLab

现代应用的定义

NGINX开源社区

弹性 应用开发 应用架构 可扩展性 可移植性

【鸿蒙千帆起】《开心消消乐》完成鸿蒙原生应用开发,创新多端联动用户体验

HarmonyOS开发者

HarmonyOS

Apache IoTDB v1.3.0 发布|增加客户端服务器 SSL 通讯加密、写入负数时间戳等功能

Apache IoTDB

代码检查规则运营需关注的10大指标

华为云开发者联盟

开发 华为云 华为云开发者联盟 华为云CodeArts

DDD落地实践-架构师眼中的餐厅 | 京东云技术团队

京东科技开发者

京东商品列表数据接口(JD.item_search)丨京东API接口

tbapi

京东API接口 京东商品数据接口 京东商品列表数据接口 关键词搜索京东商品接口 京东商品API接口

CloudQuery的过去、现在和未来

BinTools图尔兹

CloudQuery

软件测试/测试开发|一文带你了解Python列表操作

霍格沃兹测试开发学社

天谋科技工业物联网时序数据库 IoTDB 获 IT168 2023 技术卓越奖年度创新产品|技术&商品化双向认可

Apache IoTDB

dubbo线程池打满问题解决-服务重启期间 mapstruct导致

常清静

dubbo 线程池 MapStruct

用友ICT行业供应链数智化解决方案

用友BIP

供应链 ICT 行业

GitHub的DGit改进了平台的可靠性、性能以及可用性_GitHub_Sergio De Simone_InfoQ精选文章