开源分布式文件系统 GlusterFS 3.3 发布

  • 李雨来

2012 年 6 月 6 日

话题:DevOps语言 & 开发架构

Gluster 团队在 2012 年 5 月 31 日发布了GlusterFS 3.3。GlusterFS 的上一个稳定版本号是 3.2.6,虽然从版本号上看貌似改进并不大,如果你仔细阅读了 3.3 的新特性列表之后,也许会觉得 GlusterFS 社区的版本号取得太保守了。

作为 Gluster 项目的一部分,GlusterFS 项目在 2005 伊始。2007 年他们发布了第一个稳定的版本——1.2.3。2011 年 10 月 4 日,RedHat 收购了 Gluster 并开始着手开发 3.3.0 版本。同时 RedHat 还宣布了其 RedHat Storage 2.0 产品,其基础就是 GlusterFS。

GlusterFS 是一个开源的(基于 GNU GPLv3 协议)分布式文件系统,用户可以使用多台服务器,并通过以太网或者 Infiniband RDMA 互联从而组成一个 GlusterFS 的集群。GlusterFS 集群对外提供 NFS,CIFS 和 Gluster Native(通过 FUSE 进行挂载)的接口以便用户访问 GlusterFS 的存储池。 

GlusterFS 统一挂载方式(摘自http://www.gluster.org/about/

与 Hadoop HDFS 不同的是:GlusterFS 使用了弹性哈希算法来定位文件存储的位置。 由于使用了弹性哈希算法,GlusterFS 不需要专门的 Meta-Data Server 来保存元数据,因此可以避免因为元数据服务器宕机导致的整个集群不可用。也正是因为不需要元数据服务器,所以 GlusterFS 在多个挂载点同时进行数据读写的时候,其整体性能很突出。

在 GlusterFS 3.3 版本中增加的新功能包括:

  1. 统一的文件和对象存储:GlusterFS 实现了 OpenStack 里的对象存储 API 提供同步读取和写入文件或对象的数据的访问。
  2. HDFS 兼容: 使 Hadoop 的管理员在 GlusterFS 的非结构化数据上运行 MapReduce 任务,并可以通过常用的工具和 shell 脚本访问 GlusterFS 上的数据。
  3. 主动自我修复:GlusterFS 卷可以在宕机恢复之后自动从备份服务器上恢复数据。
  4. Granular 锁:允许在对大文件的自我修复过程中访问数据,这个功能对于把 GlusterFS 作为虚拟机磁盘镜像存储服务器时及其重要。
  5. 改进的复制策略:系统在写入数据时,只有当用户指定的备份数量的写入操作都完成时才返回。该功能为用户提供了在数据安全性和性能之间做权衡的能力。

如果想了解更多更详细的信息可以去 GlusterFS 的官方网站:http://www.gluster.org/


感谢郑柯对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

DevOps语言 & 开发架构