七年磨一剑:Apache HBase 1.0 正式发布

阅读数:6116 2015 年 3 月 2 日

话题:Apache大数据语言 & 开发架构AI

Apache HBase是一个高性能、面向列、可伸缩的开源分布式 NoSQL 数据库,它是 Google Bigtable 的开源实现。HBase 构建在 Hadoop 基础设施之上,用户使用它能够在廉价 PC Server 上搭建起大规模结构化存储集群。近日,从 Apache 基金会官方博客中得知,经过了七年的开发,HBase 1.0 版本正式发布。相对于先前的版本,该版本实现了 1500 项改进,且保持向后兼容。该版本值得关注的改进包括:

  • 性能提升,在保持之前的稳定性的情况下,实现了性能的提升
  • 新增了 API 和对客户端 API 进行了重组和改变
  • 使用时间轴一致区域副本以达到新的可用性保证
  • 联机配置进行了改进,从而在无需重启区域服务器的情况下, 就能够重新加载服务器配置的子集
  • 完善了相关文档,增强了可使用性

HBase 1.0 版是一个稳定版本,可以用于生产环境,而对于 0.98.x 系列版本,HBase 开发团队仍然会继续维护和开发。此外,HBase 团队将会陆续发布 1.0.x 系列版本、1.x 系列版本以及 2.0 版本等,同时新增一些大家一直期待的功能。

HBase 项目的副总裁 Michael Stack 评论到:

1.0 版本在 HBase 的发展历程是一个重要的里程碑,这是一个值得纪念的时刻,为其做出贡献的相关人员都应该感到骄傲和自豪。由于大家的共同努力,才使得 HBase 能够支撑重要的大型互联网平台。

Pinterest的首席架构师 Raghavendra Prabhu 评论到:

在 Pinterest,HBase 是一个关键的数据存储系统,Pinterest 通过使用 HBase 运行着成千上万个节点,并实现了将近每秒上千万次操作。HBase 是 Pinterest 的 Zen 图片存储服务的重要基础支撑技术,其还支撑着 Pinterest 的一些核心产品功能,如主页更新、消息、通知、网络新闻等。Pinterest 热切期待着 HBase 1.0 在可用性和可靠性方面的改进。此外,Pinterest 仍将继续与 HBase 开发社区一起致力于对 HBase 的改进工作,以满足大规模面向用户的工作负载。

HBase 项目管理委员会成员兼 HBase 1.0 版本的项目经理 Enis Söztutar 还撰写了一篇题为《Apache HBase 1.0:一个新时代的开始》的文章。在文章中,Enis Söztutar 针对 HBase 1.0 所实现的值得关注改进做了详细讲解。他指出发布 HBase 1.0 主要目的如下:

  • 为未来的 1.X 系列版本打下稳定的基础
  • 稳定运行 HBase 集群及其客户
  • 使得 HBase 版本管理和兼容性更加明确

Enis Söztutar 还指出了 HBase 的发展历程。于 2007 年,HBase 作为 Hadoop 的一个子项目开始出现;3 年后,其成为了 Apache 的顶级项目。HBase 的发展历程如下图所示:

当前,依托于 Hadoop 的迅猛发展,HBase 在大数据领域的应用越来越广泛。HBase 的用户包括众多国内外公司和组织,如苹果、Facebook、美国金融业监管局FINRA、移动市场分析公司Flurry、全球 CRM 和云计算领导者Salesforce、雅虎、小米、淘宝、百度等。


感谢郭蕾对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。