Atlassian 的 Stash 数据中心为 Git 提供了高可用性及可伸缩性

  • Steffen Opel
  • 邵思华

2015 年 4 月 19 日

话题:安全DevOpsGit语言 & 开发文化 & 方法

Atlassian最近发布了 Stash 数据中心,这是一个具有高可用性以及横向扩展能力的部署选择,用于本地源代码与 Git 库管理解决方案Stash。这套系统能够在不产生停机时间的情况下直接添加新节点,以实现双主机方式(active/active)的集群以及即时的可伸缩性。

在 Stash 推出数据中心之前,JIRA 与 Confluence 的数据中心版本已经先行问世,数据中心版本服务是为企业级使用场景设计的,这些场景要求“高可用性,以及大规模使用情况下的良好性能”。这些服务提供了与单机版产品相同的终端用户特性,它们使用了非常类似的集群技术,以实现处理大量并发用户、实现应用程序弹性以及提高服务质量的优点。这些服务的许可方式是基于用户的数量,而不是服务器或 CPU 的数量,这样就使得客户能够选择自定义的、灵活的基础设施,并且也易于估算成本。

Stash 服务器已经在“全球超过 1 万 3 千个组织中得到使用”,它包含了许多面向企业环境的特性,例如:

Stash 服务器已经为企业级的应用高可用性可伸缩性提供了详细的指南。而通过使用 Stash 数据中心集群,可以实现更高的能力。

InfoQ 有幸采访了 Atlassian 开发者工具部门的总经理Eric Wittman,谈及了 Atlassian 最新推出的数据中心服务。

InfoQ:Stach服务器已经为一个单服务器上的数千个用户提供了横向扩展的能力,这些服务器已经用于各种小型与大型公司了。那么,在 Stash数据中心中进一步提升可伸缩性的主要动力是什么呢?

Wittman:虽然你可以为大量的用户选择纵向扩展的方式,但纵向扩展受限于物理服务器的数量,而我们想避免这一点,为用户提供横向扩展的能力。一方面,我们的目的是让客户能够将扩展能力提高到 1 万个用户以上,而我们通过 Stash 数据中心提供更高的可伸缩性的另一个主要动力,是因为在各大组织不断推进它们的持续集成实践的情况下,在高峰期间,构建服务器对他们的 SCM 系统会产生极大的压力,新的数据中心将能够应对这种压力。

InfoQ:在 Stash数据中心的文档中表示,它能够以近乎线性的方式横向扩展到至少 4个以上的节点,而由于服务价格是按照用户数量进行计算的,因此你鼓励客户“想要几个节点就加几个节点”。那么对于支持的用户数量是否存在上限呢?

Wittman:我们对于 Stash 数据中心所支持的用户数量并没有设定上限。我们在测试中最多使用了 4 个节点,通过对它的可伸缩性进行衡量,我们就能得出一个集群能够处理的整体吞吐量。能够支持的用户数量不仅取决于节点的数量,也取决于来自于其它自动化系统的压力,例如持续集成。

InfoQ:对 Git进行大规模化是一种很严峻的技术挑战。你是否能简单地提一下你们是如何实现这一点的,比例你们是否对 Git的默认行为进行了一些改变?

Wittman:我们在多台机器上进行了横向扩展、添加了更多的 CPU 和内存,并且使用了本地磁盘缓存,这些都有助于缓解资源的占用,尤其是 Git 托管操作。此外,我们在集群节点上使用了额外的快速本地磁盘,这也为我们的SCM 缓存带来了好处。除此这外,我们对 Git 本身并没有进行任何改变。

  • 在 Atlassian Summit 2014 大会上,Atlassian Stash 架构师Stefan Saasen进行了一场名为“大规模化 Git”的演讲,对底层的 Git 概念、所面对的挑战和迁移进行了深入的探讨。

InfoQ:Stash通常会与 Atlassian的其它工具共同使用,例如 JIRA和 Bamboo,这样可以更好地集成工作流。你们的客户当中是否有人仅仅单独使用 Stash呢?

Wittman:我们确实有些客户仅仅使用 Stash工具,并且从 Stash的细粒度权限控制中受益良多,但多数 Stash的客户不仅使用了 Stash中细粒度的代码访问控制能力,同时也与 JIRA和 Bamboo的工作流集成使用。

InfoQ:你的同事Tim Pettersen近期详细地说明了由 Stash与 Bitbucket所带来的“更好的 pull request 模型”,但要实现这个更复杂的算法,也需要额外的资源。你能否为我们总结一下为什么你们倾向于这种途径吗?

Wittman:Stash 和 Bitbucket 中的 pull request 算法比起其它 Git 解决方案中的算法,具有两点主要的优势:

  1. 可以在 pull request 中显示出合并冲突,如果开发者的代码产生冲突,他们就可以共同讨论如何解决这个冲突。
  2. 审查者能够看到某个特性分支上的变更对 master 分支会产生怎样的影响,这样就能够对最终在产品中发布的代码有一个更好的认识,从而减少了最终会发布到客户手上的产品的缺陷数量。

InfoQ:Atlassian已经在Docker 上发布了 Stash,目前还只用于评估的目的。这一系统是否也支持集群化的部署方式,你是否认为这一系统今后能够成为你们的产品部署选项中的一种?

Wittman:Docker 部署方式目前还不支持集群化的部署,因为主要的目的是让开发者进行评估。我们将对使用 Docker 映像作为今后产品的一种部署选项进行评估,而这取决于 Docker 作为一个平台的成熟度,以及客户在这方面的需求。

Stash 3.8最近刚刚发布,进一步改善了一些操作的功能,引入了完全无头的(headless)上线过程,并且使用了 JMX 性能计数器,可用于衡量“项目与库的数量、Git 的 push 与 pull 操作的数量,以及各种线程池方面的指标”。

Stash 数据中心的文档提供了更多的细节,包括与故障转移性能可伸缩性有关的章节以及一篇FAQ。Stash用户文档同样加入了更多细节内容,而开发者文档中则涵盖了通过插件或远程REST API 对Stash 进行扩展的途径。在Atlassian 支持门户中提供了常规的 Stash 支持资源,同样也提供了专门的企业服务与支持项目

查看英文原文:Atlassian’s Stash Data Center Offers High Availability and Scalability for Git

安全DevOpsGit语言 & 开发文化 & 方法