Pivotal 开源其大数据套件

  • Abel Avram
  • 张晓鹏

2015 年 3 月 3 日

话题:开源大数据架构AI

Pivotal 决定开源其大数据套件和核心组件,并宣布成立 ODP(Open Data Platform)组织,ODP 旨在倡导和推进大数据领域的开源和标准化。

相比 HortonWorks、Cloudera 和 MapR 这些早先的玩家,Pivotal 是大数据市场的后来者。但现在,为了解决大数据领域“分裂(fragmentation)和供应商锁定(vendor lock-in)”的问题,Pivotal 决定将其大数据套件中的一些产品进行开源。这些产品包括Greenplum Database(并行处理的数据仓库)、HAWQ(和 ANSI 标准兼容的 Hadoop 上的 SQL 查询引擎)和GemFire(分布式内存中的 NoSQL 数据库)

迈克尔·库基(Michael Cucchi),Pivotal 的产品市场总监,对这一过程及其背后的原因提供了更多的细节。按照库基所说,客户虽然喜欢“Pivotal 大数据套件的灵活性”,但他们的购买偏好却在发生变化,这其中的原因在于“这些日子客户想尽办法来争取同开源技术相结合,特别是在 IT 的基础设施领域”。所以结果就是,Pivotal 决定开源其大数据套件的核心部分,并且库基也提到他们意图开源其套件的所有组件。

按照库基所说,开源的过程已经“进行了一段时间”,主要是处理一些复杂的事情,比如软件许可、知识产权和产品管治,并为后面的行动提供一些细节。

详细的计划还正在敲定中,但是 Pivotal 已计划按季度的节奏来开始发布和孵化Pivotal GemFirePivotal HAWQPivotal Greenplum Database。现在 Pivotal 已接近完成 GemFire、Greenplum Database 和 HAWQ 代码所有权的结构改造,使其成为最适合大数据社区工作的实体。

Pivotal 还宣布成立 ODP(Open Data Platform)组织,初创的 15 个公司包括 Hortonworks、IBM、Infosys、GE、SAS 等,这些公司致力于推进大数据领域的开源和标准化。第一批被 ODP 关注的组件包括 Ambari、HDFS、MapReduce 和 YARN,而且 Pivotal 很可能会将其套件的源码委托给 ODP 来管理。

于此同时,Pivotal 的大数据组件还进行了一些服务上的增强:在 Cloud Foundry 上利用 Operations Manager 来部署套件的能力;以及同 Spring XD(Pivotal 的大数据集成运行环境)、Redis 和 RabbitMQ 进行集成。按照库基所说,下一个版本的 Pivotal HD(Pivotal 的 Hadoop 发行版)将会同 Spark 以及“所有可用的 Apache 项目”进行集成。

查看英文原文:Pivotal Open Sources Their Big Data Suite

开源大数据架构AI