写点什么

不同实时 Hadoop 实现之间竞争升温

  • 2013-02-27
  • 本文字数:782 字

    阅读完需:约 3 分钟

自从 Google 的 Dremel 论文发表以来,Hadoop 社区已经在尝试围绕 Hadoop 实现类似功能。首先出现的是 OpenDremel ,目前它已经是 Apache Drill 的一部分,而后者已于去年成为 Apache 孵化项目。之后,也是在去年,Cloudera 引入了 Impala ,目前仍处于 beta 状态,它还是 Cloudera Hadoop 发布版——CDH 4.1 的一部分。

Stinger Initiative 是该领域新的竞争者,由 Hortonworks 于上周引入 Apache 的孵化过程,其目标是:

让 Hive 能在人的响应时间内处理很多用例(也就是 5-30 秒这一区间范围内的查询)——如大数据的查看、可视化和参数化报表——而无需安装、维护和学习其他工具,这能够为拥有 Hive 技巧和投资的大型社区带来很多价值。

Hortonworks 打算通过以下手段实现该目标:

  • 改进 Hive 的 SQL 兼容性,包括支持 Hive 中没有的 SQL 类型和‘where’子句中的子查询。
  • 优化 Hive 的执行计划。
  • 支持新的 Hadoop 列格式 ORCFile(类似于 Dremel、Drill 和 Cloudera 的 Trevini )。
  • 引入基于 YARN 的新的运行时框架 Tez

Tez 是北印度语的“速度(speed)”,该项目还处于等待投票成为 Apache 孵化项目的阶段。它是:

……一种通用的、高度可定制的框架,用于简化 Hadoop 中数据处理任务的创建,支持小规模(低延迟)和大规模(高吞吐量)负载。通过提供为一个作业执行复杂 DAG(有向无环图)任务的能力,它将 MapReduce 范型推广为一种更强大的框架,这样 Apache Hadoop 生态系统中的项目(如 Apache Hive、Apache Pig 和 Cascading)就能满足人机交互响应时间和 PB 级规模极端吞吐量的需求了(无疑 MapReduce 是实现这一点的关键驱动因素)。

当前的三个“实时”Hadoop 查询实现——Drill、Impala 和现在的 Stinger 或是已经开源,或是很快就会开源,都将能够利用社区的支持和投入来解决实时 Hadoop 查询的重要问题。

查看英文原文 Competition between Real-time Hadoop Implementations Heats Up

2013-02-27 07:074630
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 143.5 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

【架构师训练营第 1 期 10 周】 作业

Bear

极客大学架构师训练营

食堂就餐卡系统设计

ルンルン

第 10 周 作业

Pyr0man1ac

技术选型总结二

Mars

技术选型

BATJ一线大厂面试必问的4大框架源码,该如何学习?

Java架构师迁哥

Spring中的线程池与任务调度

Rayjun

Java spring 线程池

第 10 周 模块分解

Pyr0man1ac

架構師訓練營第 1 期 - 第 10 周作業

Panda

架構師訓練營第 1 期

【第十周】课后作业

薇凉

第十周学习总结

knight

Week6 (技术选型二)作业 2

Sean Chen

JVM垃圾回收

少林寺三毛

JVM

LeetCode题解:121. 买卖股票的最佳时机,一次遍历,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

训练营第六周作业

大脸猫

极客大学架构师训练营

训练营第六周总结

大脸猫

极客大学架构师训练营

架构师 01 期,第十周课后作业

子文

CAP原理简述&Doris 临时失效处理过程

Mars

CAP原理

Week 6 作业

evildracula

学习 架构

架构方法 - 学习笔记

心晴雨亦晴(~o~)

架构师训练营 - 第 10 周课后作业(1 期)

阿甘

架构师训练营第六周学习笔记

李日盛

笔记

架构师训练营第一周”架构方法“学习笔记

随秋

极客大学架构师训练营

第六周 cap原理

落朽

【第十周】课后作业

云龙

第六周 cap原理

Geek_9527

「架构师训练营第 1 期」第十周作业

张国荣

关于微服务架构

天天向上

极客大学架构师训练营

Week6 (技术选型二)作业1

Sean Chen

第六周学习总结

晴空万里

架构师训练营第六周作业

李日盛

CAP

架构师训练营第一周”架构方法“作业

随秋

极客大学架构师训练营

不同实时Hadoop实现之间竞争升温_大数据_Boris Lublinsky_InfoQ精选文章