2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

O ' reilly 阶层会议暨 Hadoop 世界 2012:Azure HDInsight,Cloudera Impala,MapR M7

  • 2012-11-30
  • 本文字数:1518 字

    阅读完需:约 5 分钟

在今年的 O ' reilly 阶层会议暨 Hadoop 世界期间,除了一系列非常有趣的报告之外,还有几个关于微软 Azure HDInsight、Cloudera Impala 和 MapR M7 等重要供应商的产品发布。

微软 Hortonworks 推出它们基于云的 Hadoop Azure 服务,现在称为 Windows Azure HDInsight 服务。微软技术研究员大卫•坎贝尔说:

“大数据应该提供商业解决方案,而不是带来 IT 复杂性。Windows 服务器和 Azure 提供的 Hadoop 兼容能力显著降低了安装和部署的门槛,使客户能够从任何数据、任何规模、本地或云上获得商业洞察力。”

HDInsight 服务器设计在 Windows Server 和 Microsoft SQL Server 上工作。在 Windows 下,HDInsight 集成了用于管理控制的 Microsoft System Center 和用于访问控制与安全的 Active Directory。HDInsight(本地和云) 支持连接到微软 SQL Server 以实现商业智能

“……从面向用户的工具和组件(包括 Microsoft Excel、PowerPivot Excel 和 Power View)开始。几乎没有人不使用 Excel,它可处理从任何 Hadoop 环境的提取的数据。”

HDInsight 可以使用户在几分钟内旋转和部署 Hadoop 集群。此服务将与现有的 MapReduce 服务展开竞争(包括亚马逊 Web 服务的 Elastic Map Reduce )。此外,Azure 将运营数据交易市场,使用户能够互相买卖数据。

Cloudera 发布了实时查询项目 Impala ,它服务于几秒钟内完成的实时 SQL 查询,支持与领先 BI 工具的集成。Impala 提供本地分布式查询引擎和一个低延迟调度器,可以在 HDFS 和 HBase 上操作数据存储。它利用了 Apache Hive 元仓库,兼容 Hive SQL 语法、ODBC 驱动程序和 Beeswax GUI(在 Hue 中)。

Cloudera 声称新平台已进入公测,可以以比 Hive/MapReduce 快 10 到 30 倍的效率处理查询。虽然 Cloudera 的营销材料宣称处理速度为“实时”和“思维速度”,该公司的首席架构师却认为,在数据分析中,“实时”更好的说法是“较少的等待”。

首批 Impala 的 beta 测试者之一 Expedia 说:

“现在,我们能够在一个统一的大数据平台上归档、ETL 和分析,而不需要许多不同的系统。……Hadoop 的这个演变使我们减少了 50% 的延迟,并产生了新的真正的商业洞察力服务,而以前是不可行的。”

如果你仔细分析为何公司可处理比以前更多的内部数据时,给你印象最深的就是增加的速度。但这些庞大的数据集还创造很大的后台问题,特别是延迟。

最后, MapR Technologies 介绍了他们的新版本——M7,它简化了 HBase 管理,并使它自己成为企业级数据库平台。

对于 M7

“……该公司与 HBase 已经共同努力解决了大量的可靠性和管理问题。该公司的目标是简化底层架构,如何让不同的产品在一起工作,并使其尽可能的简单。Norris 说,管理平台已更加易用,并且它也为客户提供了统一管理、统一数据保护、一致访问,比之前的平台有更高的灵活性和性能。”

M7 白皮书上说:

“M7 有一个特制的架构,专门设计用来优化存储,并能在统一平台中处理表和文件。这种统一性应用了 MapR 已有的管理能力、访问和保护表数据的能力。M7 消除了 HBase 的分层架构,于是 HBase 应用程序仅通过一个网络中继就可以直接访问数据,无需任何额外的通信层延误。M7 架构将文件和表集成到单个数据存储,给 HBase 应用带来更加简化的管理和开发、极佳的可靠性、空前的性能和可扩展性”

大会的演讲稿主题演讲和访谈可以从其网站下载。

查看英文原文 News from O’Reilly Strata Conference + Hadoop World 2012: Azure HDInsight, Cloudera Impala, MapR M7


感谢马国耀对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2012-11-30 09:341502

评论

发布
暂无评论
发现更多内容

AI界的革命!终于可以自动标注了!

百度大脑

人工智能 百度

一文让你彻底搞懂Spring状态及原理,实现订单与物流解耦

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

一文读懂Hive数据存储格式

五分钟学大数据

11月日更

如何定义SpringBoot项目配置文件中密码的加密

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

【等保】等保3.0是什么意思?有等保3.0吗?

行云管家

网络安全 等保 等级保护 等保2.0

【高并发】从源码角度深度解析线程池是如何实现优雅退出的

冰河

Java 并发编程 多线程 高并发 异步编程

“阿里巴巴”再次出手,这份Github新开源303页Spring全家桶高级笔记,让你打开眼界

热爱java的分享家

Java 架构 面试 程序人生 编程语言

ApplePay应用内购(inapp)支付流程图

try catch

支付 applepay 苹果支付

uniapp+若依 开发租房小程序

詹Sir

大前端

Python爬虫采集,中介网互联网网站排行榜, 样本数量:58341

梦想橡皮擦

11月日更

想一个问题,在高并发中,如何部署奇数个节点?

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

教你用SQL进行数据分析

华为云开发者联盟

Python sql 数据分析 数据 BI 分析工具

SpringBoot+WebSocket实时监控异常

热爱java的分享家

Java spring 架构 程序人生 编程语言

熵简技术谈 | 熵简科技在资管数据中台的探索与实践

熵简科技

数据挖掘 数据库 大数据 数据中台 数据分析

问题也许没有看上去那么简单

神策技术社区

神策数据

动态模型之动态增减【FunTester测试框架】

FunTester

性能测试 接口测试 测试框架 FunTester 动态模型

flutter 开发中 vscode 插件推荐 2

坚果

flutter vscode 11月日更

一周信创舆情观察(11.8~11.14)

统小信uos

【混合云小知识】混合云四种形式简单说明

行云管家

云计算 公有云 私有云 混合云 云管理

SCTL 涅槃重生:投入 RAL 的怀抱

SphereEx

Java 数据库 大前端 ShardingSphere SCTL

技术分享| 如何使用FFmpeg命令处理音视频

anyRTC开发者

音视频 WebRTC ffmpeg 视频通话

元数据管理在数据仓库的实践应用

大数据技术指南

11月日更

​Qt全球峰会2021中国站深入解读最新Qt 6.2长周期版本,助力企业数字化转型

请说说RPC的一个请求的流程是怎么样的?

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

DOM操作造成的页面卡顿问题及解决

CRMEB

更改Apollo数据库为oracle

小鲍侃java

11月日更

武林大会之国产数据库风云榜-2021年11月

墨天轮

数据库 opengauss oceanbase 国产数据库

Python量化数据仓库搭建系列1:数据库安装与操作

恒生LIGHT云社区

量化投资

鱼龙混杂的低代码市场,企业选型需关注哪些重点?

优秀

低代码 企业数字化转型

.NET6 引入Autofac

面向对象的猫

.net6 快速上手.net6

O ' reilly阶层会议暨Hadoop世界2012:Azure HDInsight,Cloudera Impala,MapR M7_大数据_Boris Lublinsky_InfoQ精选文章