AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

不同实时 Hadoop 实现之间竞争升温

  • 2013-02-27
  • 本文字数:782 字

    阅读完需:约 3 分钟

自从 Google 的 Dremel 论文发表以来,Hadoop 社区已经在尝试围绕 Hadoop 实现类似功能。首先出现的是 OpenDremel ,目前它已经是 Apache Drill 的一部分,而后者已于去年成为 Apache 孵化项目。之后,也是在去年,Cloudera 引入了 Impala ,目前仍处于 beta 状态,它还是 Cloudera Hadoop 发布版——CDH 4.1 的一部分。

Stinger Initiative 是该领域新的竞争者,由 Hortonworks 于上周引入 Apache 的孵化过程,其目标是:

让 Hive 能在人的响应时间内处理很多用例(也就是 5-30 秒这一区间范围内的查询)——如大数据的查看、可视化和参数化报表——而无需安装、维护和学习其他工具,这能够为拥有 Hive 技巧和投资的大型社区带来很多价值。

Hortonworks 打算通过以下手段实现该目标:

  • 改进 Hive 的 SQL 兼容性,包括支持 Hive 中没有的 SQL 类型和‘where’子句中的子查询。
  • 优化 Hive 的执行计划。
  • 支持新的 Hadoop 列格式 ORCFile(类似于 Dremel、Drill 和 Cloudera 的 Trevini )。
  • 引入基于 YARN 的新的运行时框架 Tez

Tez 是北印度语的“速度(speed)”,该项目还处于等待投票成为 Apache 孵化项目的阶段。它是:

……一种通用的、高度可定制的框架,用于简化 Hadoop 中数据处理任务的创建,支持小规模(低延迟)和大规模(高吞吐量)负载。通过提供为一个作业执行复杂 DAG(有向无环图)任务的能力,它将 MapReduce 范型推广为一种更强大的框架,这样 Apache Hadoop 生态系统中的项目(如 Apache Hive、Apache Pig 和 Cascading)就能满足人机交互响应时间和 PB 级规模极端吞吐量的需求了(无疑 MapReduce 是实现这一点的关键驱动因素)。

当前的三个“实时”Hadoop 查询实现——Drill、Impala 和现在的 Stinger 或是已经开源,或是很快就会开源,都将能够利用社区的支持和投入来解决实时 Hadoop 查询的重要问题。

查看英文原文 Competition between Real-time Hadoop Implementations Heats Up

2013-02-27 07:074552
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 140.7 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

【数梦工场】【智慧航空AI大赛】比赛分享

阿里云天池

俄罗斯加密货币挖矿合法化:重新定义全球挖矿行业的格局

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

利用Python和API接口获取1688商品列表数据的方法

tbapi

1688 1688API 1688商品列表数据接口 关键词搜索1688接口

NFS v3及v4协议区别

天翼云开发者社区

云计算 NFS

一本小册子,咋就让IT人水灵灵地「由I变E」了?

脑极体

AI

机器学习算法: 朴素贝叶斯(Naive Bayes)

阿里云天池

深入探索:淘宝/天猫商品详情API返回值实战解析与应用

代码忍者

API 接口 API 测试

nvme磁盘故障注入方法

天翼云开发者社区

nvme 磁盘 磁盘故障

三十分钟入门基础Go(Java小子版)

京东科技开发者

TDengine 签约协鑫鑫光,优化光伏数据管理

TDengine

记一次 Python 应用开发频繁假死的问题

我再BUG界嘎嘎乱杀

Python 编程 后端 开发语言

京粉智能推广助手-LLM based Agent在联盟广告中的应用与落地

京东科技开发者

打造垂直领域内容的问答机器人

霍格沃兹测试开发学社

一文让你知道为什么电力行业需要堡垒机

行云管家

电力 等保 堡垒机

如何创建良好的数据模型?

NocoBase

低代码 数据模型 无代码

【参赛总结】第二届云原生编程挑战赛-冷热读写场景的RocketMQ存储系统设计 - Ninety Percent 战队

阿里云天池

IROS 2020 OCRTOC比赛总结 - Team PHAI Robotics

阿里云天池

不只是前端,后端、产品和测试也需要了解的浏览器知识(二)

京东科技开发者

京东商品详情API:解锁数据分析与决策支持的新商业价值

代码忍者

万界星空科技低代码云MES--快速实现数字化

万界星空科技

低代码平台 mes 云mes 万界星空科技 低代码云MES

CVPR 2021 ImageNet 无限制对抗攻击 TOP 4 (Advers) 方案分享

阿里云天池

人工智能丨打造垂直领域内容的问答机器人

测试人

软件测试

一本小册子,咋就让IT人水灵灵地「由I变E」了?

白洞计划

AI

Go语言手写本地 LRU 缓存

FunTester

不同实时Hadoop实现之间竞争升温_大数据_Boris Lublinsky_InfoQ精选文章