写点什么

不同实时 Hadoop 实现之间竞争升温

  • 2013-02-27
  • 本文字数:782 字

    阅读完需:约 3 分钟

自从 Google 的 Dremel 论文发表以来,Hadoop 社区已经在尝试围绕 Hadoop 实现类似功能。首先出现的是 OpenDremel ,目前它已经是 Apache Drill 的一部分,而后者已于去年成为 Apache 孵化项目。之后,也是在去年,Cloudera 引入了 Impala ,目前仍处于 beta 状态,它还是 Cloudera Hadoop 发布版——CDH 4.1 的一部分。

Stinger Initiative 是该领域新的竞争者,由 Hortonworks 于上周引入 Apache 的孵化过程,其目标是:

让 Hive 能在人的响应时间内处理很多用例(也就是 5-30 秒这一区间范围内的查询)——如大数据的查看、可视化和参数化报表——而无需安装、维护和学习其他工具,这能够为拥有 Hive 技巧和投资的大型社区带来很多价值。

Hortonworks 打算通过以下手段实现该目标:

  • 改进 Hive 的 SQL 兼容性,包括支持 Hive 中没有的 SQL 类型和‘where’子句中的子查询。
  • 优化 Hive 的执行计划。
  • 支持新的 Hadoop 列格式 ORCFile(类似于 Dremel、Drill 和 Cloudera 的 Trevini )。
  • 引入基于 YARN 的新的运行时框架 Tez

Tez 是北印度语的“速度(speed)”,该项目还处于等待投票成为 Apache 孵化项目的阶段。它是:

……一种通用的、高度可定制的框架,用于简化 Hadoop 中数据处理任务的创建,支持小规模(低延迟)和大规模(高吞吐量)负载。通过提供为一个作业执行复杂 DAG(有向无环图)任务的能力,它将 MapReduce 范型推广为一种更强大的框架,这样 Apache Hadoop 生态系统中的项目(如 Apache Hive、Apache Pig 和 Cascading)就能满足人机交互响应时间和 PB 级规模极端吞吐量的需求了(无疑 MapReduce 是实现这一点的关键驱动因素)。

当前的三个“实时”Hadoop 查询实现——Drill、Impala 和现在的 Stinger 或是已经开源,或是很快就会开源,都将能够利用社区的支持和投入来解决实时 Hadoop 查询的重要问题。

查看英文原文 Competition between Real-time Hadoop Implementations Heats Up

2013-02-27 07:074612
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 142.9 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

从小白程序员到大厂高级技术专家我看过哪些书籍?

冰河

程序员 程序人生 冰河 推荐书单

用 Sublime Text 编辑 Markdown

U2647

sublime-text markdown 4月日更

深度分析区块链是如何改变世界的

CECBC

区块链

不想写代码偷懒之配置化

顿晓

大前端 配置化开发 4月日更

智慧公安重点人员管控系统搭建,助推公安智慧化发展

13828808769

区块链+ #区块链#

配置化开发是否可行?

顿晓

重构 配置化开发 4月日更

WordPress统计文章浏览次数

Sakura

4月日更

当云计算飞向深空

脑极体

区块链赋能文化旅游,推动旅游行业转型升级

13828808769

区块链 #区块链#

区块链BaaS平台,创造不一样的服务

电微13828808271

区块链+

重构: 自己挖的坑自己填

夏兮。

Java 重构 测试 单元测试

打完新冠疫苗后要注意的两件事

石云升

28天写作 新冠疫苗 4月日更

制作颜色选择器(全)

空城机

JavaScript Vue 大前端 4月日更 颜色选择器

Kafka又出问题了!

冰河

kafka 消息队列 消息中间件 异步编程

机器学习 | 数据缩放与转换方法(1)

披头

智慧党建系统搭建,干部管理平台开发

Python OpenCV 之图像乘除与像素的逻辑运算,图像处理取经之旅第 17 天

梦想橡皮擦

Python OpenCV 4月日更

区块链技术推动自然资源领域信息化发展

13828808769

区块链+ #区块链#

Hive相关的总结

大数据技术指南

hive 4月日更

架构实战营-模块1-作业

泄矢的呼啦圈

架构实战营

雄安区块链实验室副主任李军:把区块链植入数字雄安

CECBC

区块链

Redis split-brain 脑裂

escray

redis 学习 极客时间 Redis 核心技术与实战 4月日更

【死磕JVM】给同事讲了一遍GC后,他要去面试,年轻人,就是容易冲动!

牧小农

JVM 垃圾回收 垃圾收集 垃圾回收算法

大数据计算生态之数据计算(一)

小舰

4月日更

聪明人的训练(三)

Changing Lin

4月日更

重点人员可视化管理平台搭建,公安指挥调度平台

基于角色访问控制RBAC权限模型的动态资源访问权限管理实现

crudapi

spring security 权限 rbac crudapi 角色

架构训练营模块1作业-江哲

江哲

作业

“圈粉”行业龙头 数字人民币搅动投资江湖

CECBC

数字人民币

区块链BaaS平台+BI大数据系统

电微13828808271

区块链+

Kafka的再平衡机制

五分钟学大数据

kafka 4月日更

不同实时Hadoop实现之间竞争升温_大数据_Boris Lublinsky_InfoQ精选文章