使用 Hummingbird 提升 Rackspace Cloud Files 的性能

  • 谢丽

2015 年 10 月 26 日

话题:Python语言 & 开发架构Go

Rackspace Cloud Files是一个使用OpenStack Swift构建的大规模云对象存储系统。随着发展,该系统遇到了许多可扩展性问题。近日,Cloud Files项目经理 Matt Barker撰文介绍了他们遇到的问题以及 Hummingbird 如何提升了 Cloud Flies 的性能。

OpenStack Swift 是 Rackspace 于 2010 年推出的一个存储项目,用 Python 编写,是原始 OpenStack 平台的一部分。为了保证可扩展性和硬件部署架构的灵活性,Swift 被分解为一个公共服务(代理服务)和三个内部服务(对象服务、容器服务、账户服务)。其中,对象服务层(即对象服务器和复制器)自创建以来几乎没有变化。但随着Cloud Files的发展,Python 的局限性显现出来。比如,它在并发支持和磁盘 I/O 方面的局限会导致对象服务层成为瓶颈。

他们考虑了许多不同的方法,包括配置更多的对象工作进程、修改并发设置及加入事件循环。但是,当一个节点在硬件或磁盘层面出现故障时,Python 对象服务会让问题变得更加严重。对象服务器会完全没有响应,或者继续接受连接,但提供数据非常缓慢,许多请求都需要很长的时间才能完成。Cloud Files 团队运行和优化服务的时间都赶上开发新特性了。

为了解决上述问题,Cloud Files 团队首席工程师 Michael Barton 开始尝试使用各种语言框架重写对象服务器。基准测试表明,Go 是一个不错的选择。于是,他们就使用 Go 语言重新编写和部署对象服务,即Hummingbird项目。在 API 层面,Hummingbird 具备与 Swift 相同的功能。他们还创建了一个测试套件,用于在对象服务器和对象复制器层面比较两者的性能。接下来,他们将Hummingbird部署到弗吉尼亚数据中心的单个生产节点上,然后依次扩展到一个 4 节点“区域(zone)”、半个集群、整个“地区(region)”。截至目前,他们已经在弗吉尼亚和伦敦数据中心这两个生产环境中部署了 Hummingbird。在弗吉尼亚地区,每小时的读超时数量显著减少,如下图所示:

而在响应速度方面,Go 对象服务器大约是 Python 对象服务器的两倍。

目前,Hummingbird 已经成为 OpenStack Swift 的一个特性分支,感兴趣的读者可以查看其GitHub 页面。另外,在将于 10 月 27 日举行的东京 OpenStack 峰会上,Michael 及资深软件开发工程师 David Goetz 将会对 Hummingbird 进行介绍,感兴趣的读者可以关注一下。


感谢郭蕾对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

Python语言 & 开发架构Go