NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

O ' reilly 阶层会议暨 Hadoop 世界 2012:Azure HDInsight,Cloudera Impala,MapR M7

  • 2012-11-30
  • 本文字数:1518 字

    阅读完需:约 5 分钟

在今年的 O ' reilly 阶层会议暨 Hadoop 世界期间,除了一系列非常有趣的报告之外,还有几个关于微软 Azure HDInsight、Cloudera Impala 和 MapR M7 等重要供应商的产品发布。

微软 Hortonworks 推出它们基于云的 Hadoop Azure 服务,现在称为 Windows Azure HDInsight 服务。微软技术研究员大卫•坎贝尔说:

“大数据应该提供商业解决方案,而不是带来 IT 复杂性。Windows 服务器和 Azure 提供的 Hadoop 兼容能力显著降低了安装和部署的门槛,使客户能够从任何数据、任何规模、本地或云上获得商业洞察力。”

HDInsight 服务器设计在 Windows Server 和 Microsoft SQL Server 上工作。在 Windows 下,HDInsight 集成了用于管理控制的 Microsoft System Center 和用于访问控制与安全的 Active Directory。HDInsight(本地和云) 支持连接到微软 SQL Server 以实现商业智能

“……从面向用户的工具和组件(包括 Microsoft Excel、PowerPivot Excel 和 Power View)开始。几乎没有人不使用 Excel,它可处理从任何 Hadoop 环境的提取的数据。”

HDInsight 可以使用户在几分钟内旋转和部署 Hadoop 集群。此服务将与现有的 MapReduce 服务展开竞争(包括亚马逊 Web 服务的 Elastic Map Reduce )。此外,Azure 将运营数据交易市场,使用户能够互相买卖数据。

Cloudera 发布了实时查询项目 Impala ,它服务于几秒钟内完成的实时 SQL 查询,支持与领先 BI 工具的集成。Impala 提供本地分布式查询引擎和一个低延迟调度器,可以在 HDFS 和 HBase 上操作数据存储。它利用了 Apache Hive 元仓库,兼容 Hive SQL 语法、ODBC 驱动程序和 Beeswax GUI(在 Hue 中)。

Cloudera 声称新平台已进入公测,可以以比 Hive/MapReduce 快 10 到 30 倍的效率处理查询。虽然 Cloudera 的营销材料宣称处理速度为“实时”和“思维速度”,该公司的首席架构师却认为,在数据分析中,“实时”更好的说法是“较少的等待”。

首批 Impala 的 beta 测试者之一 Expedia 说:

“现在,我们能够在一个统一的大数据平台上归档、ETL 和分析,而不需要许多不同的系统。……Hadoop 的这个演变使我们减少了 50% 的延迟,并产生了新的真正的商业洞察力服务,而以前是不可行的。”

如果你仔细分析为何公司可处理比以前更多的内部数据时,给你印象最深的就是增加的速度。但这些庞大的数据集还创造很大的后台问题,特别是延迟。

最后, MapR Technologies 介绍了他们的新版本——M7,它简化了 HBase 管理,并使它自己成为企业级数据库平台。

对于 M7

“……该公司与 HBase 已经共同努力解决了大量的可靠性和管理问题。该公司的目标是简化底层架构,如何让不同的产品在一起工作,并使其尽可能的简单。Norris 说,管理平台已更加易用,并且它也为客户提供了统一管理、统一数据保护、一致访问,比之前的平台有更高的灵活性和性能。”

M7 白皮书上说:

“M7 有一个特制的架构,专门设计用来优化存储,并能在统一平台中处理表和文件。这种统一性应用了 MapR 已有的管理能力、访问和保护表数据的能力。M7 消除了 HBase 的分层架构,于是 HBase 应用程序仅通过一个网络中继就可以直接访问数据,无需任何额外的通信层延误。M7 架构将文件和表集成到单个数据存储,给 HBase 应用带来更加简化的管理和开发、极佳的可靠性、空前的性能和可扩展性”

大会的演讲稿主题演讲和访谈可以从其网站下载。

查看英文原文 News from O’Reilly Strata Conference + Hadoop World 2012: Azure HDInsight, Cloudera Impala, MapR M7


感谢马国耀对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2012-11-30 09:34934

评论

发布
暂无评论
发现更多内容

深圳前端开发培训机构学习该如何选择?

小谷哥

JavaScript刷LeetCode拿offer-分治

Geek_07a724

JavaScript LeetCode

三项第一!天翼云通过DevSecOps能力成熟度评估认证

天翼云开发者社区

数字先锋| 打造城市“一朵云”,天翼云推动芜湖新型智慧城市建设

天翼云开发者社区

HummerRisk 使用场景:混合云安全治理(1)简介

HummerCloud

混合云 安全合规检测 11月月更

前端leetcde算法面试套路之双指针

js2030code

JavaScript LeetCode

个保法一周年,每日互动(个推)分享隐私计算探索及实践

个推

大数据 联邦学习 数据治理 隐私计算 隐私安全

HDC2022 开发者亮点抢先看,线上线下精彩活动等你探索!

HarmonyOS开发者

HarmonyOS

微信业务架构-探讨

Weldon

架构实战营

TDengine | taosdump 的使用方法和注意事项

TDengine

数据库 tdengine 时序数据库

企业数字化转型思考

dreamer

软件 数字化转型 信息化 制造业 智能化

大数据培训哪个比较好

小谷哥

原生 JS 手写一个优雅的图片预览功能,带你吃透背后原理

茶无味的一天

JavaScript 前端 HTML5, CSS3 图片预览

云安全厂商那么多,我们该怎么选择?

行云管家

云计算 企业上云 云厂商 云转售

AntDB内存管理之内存上下文

亚信AntDB数据库

AntDB aisware antdb AntDB数据库 企业号十月PK榜 企业号十月 PK 榜

LED显示屏的扫描模式及基本工作原理

Dylan

LED LED显示屏 led显示屏厂家

武汉web前端培训机构去哪好?

小谷哥

亮相IDC年度盛典,天翼云以科技创新谱写数字化转型新乐章

天翼云开发者社区

前端刷完这12道滑动窗口,就可以出山面试了

js2030code

JavaScript LeetCode

【学习记录】SQL注入--盲注

w010w

网络安全 学习笔记 CTF SQL注入 11月月更

一文读懂加密资产板块的盈利潜力与投资机会

股市老人

转转图书对基于Drools引擎的DMN实践

转转技术团队

drools 规则引擎使用 规则引擎 转转 java 编程

浅谈系统稳定性与高可用保障的几种思路

得物技术

高可用 架构设计 稳定性 稳定性保障 10月月更

共享存储是什么意思?与DRBD有什么区别?

行云管家

高可用 ha Skybility HA 高可用性

盘点具备盈利潜力的几大加密板块,以及潜在的投资机会

EOSdreamer111

【C++多线程那些事儿】多线程的执行顺序如你预期吗?

C++后台开发

线程 多线程 后端开发 linux开发 C++开发

实例解读丨关于GaussDB ETCD服务异常

华为云开发者联盟

数据库 华为云 企业号十月 PK 榜

BizWorks 应用平台基于 KubeVela 的实践

阿里巴巴云原生

阿里云 开源 云原生

前端leetcde算法面试套路之回溯

js2030code

JavaScript LeetCode

【融云出海白皮书免费看】-巴西成增量潜力「应许之地」

融云 RongCloud

互联网 白皮书

golang中的错误处理

六月的

golang 错误处理

O ' reilly阶层会议暨Hadoop世界2012:Azure HDInsight,Cloudera Impala,MapR M7_大数据_Boris Lublinsky_InfoQ精选文章