NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

O ' reilly 阶层会议暨 Hadoop 世界 2012:Azure HDInsight,Cloudera Impala,MapR M7

  • 2012-11-30
  • 本文字数:1518 字

    阅读完需:约 5 分钟

在今年的 O ' reilly 阶层会议暨 Hadoop 世界期间,除了一系列非常有趣的报告之外,还有几个关于微软 Azure HDInsight、Cloudera Impala 和 MapR M7 等重要供应商的产品发布。

微软 Hortonworks 推出它们基于云的 Hadoop Azure 服务,现在称为 Windows Azure HDInsight 服务。微软技术研究员大卫•坎贝尔说:

“大数据应该提供商业解决方案,而不是带来 IT 复杂性。Windows 服务器和 Azure 提供的 Hadoop 兼容能力显著降低了安装和部署的门槛,使客户能够从任何数据、任何规模、本地或云上获得商业洞察力。”

HDInsight 服务器设计在 Windows Server 和 Microsoft SQL Server 上工作。在 Windows 下,HDInsight 集成了用于管理控制的 Microsoft System Center 和用于访问控制与安全的 Active Directory。HDInsight(本地和云) 支持连接到微软 SQL Server 以实现商业智能

“……从面向用户的工具和组件(包括 Microsoft Excel、PowerPivot Excel 和 Power View)开始。几乎没有人不使用 Excel,它可处理从任何 Hadoop 环境的提取的数据。”

HDInsight 可以使用户在几分钟内旋转和部署 Hadoop 集群。此服务将与现有的 MapReduce 服务展开竞争(包括亚马逊 Web 服务的 Elastic Map Reduce )。此外,Azure 将运营数据交易市场,使用户能够互相买卖数据。

Cloudera 发布了实时查询项目 Impala ,它服务于几秒钟内完成的实时 SQL 查询,支持与领先 BI 工具的集成。Impala 提供本地分布式查询引擎和一个低延迟调度器,可以在 HDFS 和 HBase 上操作数据存储。它利用了 Apache Hive 元仓库,兼容 Hive SQL 语法、ODBC 驱动程序和 Beeswax GUI(在 Hue 中)。

Cloudera 声称新平台已进入公测,可以以比 Hive/MapReduce 快 10 到 30 倍的效率处理查询。虽然 Cloudera 的营销材料宣称处理速度为“实时”和“思维速度”,该公司的首席架构师却认为,在数据分析中,“实时”更好的说法是“较少的等待”。

首批 Impala 的 beta 测试者之一 Expedia 说:

“现在,我们能够在一个统一的大数据平台上归档、ETL 和分析,而不需要许多不同的系统。……Hadoop 的这个演变使我们减少了 50% 的延迟,并产生了新的真正的商业洞察力服务,而以前是不可行的。”

如果你仔细分析为何公司可处理比以前更多的内部数据时,给你印象最深的就是增加的速度。但这些庞大的数据集还创造很大的后台问题,特别是延迟。

最后, MapR Technologies 介绍了他们的新版本——M7,它简化了 HBase 管理,并使它自己成为企业级数据库平台。

对于 M7

“……该公司与 HBase 已经共同努力解决了大量的可靠性和管理问题。该公司的目标是简化底层架构,如何让不同的产品在一起工作,并使其尽可能的简单。Norris 说,管理平台已更加易用,并且它也为客户提供了统一管理、统一数据保护、一致访问,比之前的平台有更高的灵活性和性能。”

M7 白皮书上说:

“M7 有一个特制的架构,专门设计用来优化存储,并能在统一平台中处理表和文件。这种统一性应用了 MapR 已有的管理能力、访问和保护表数据的能力。M7 消除了 HBase 的分层架构,于是 HBase 应用程序仅通过一个网络中继就可以直接访问数据,无需任何额外的通信层延误。M7 架构将文件和表集成到单个数据存储,给 HBase 应用带来更加简化的管理和开发、极佳的可靠性、空前的性能和可扩展性”

大会的演讲稿主题演讲和访谈可以从其网站下载。

查看英文原文 News from O’Reilly Strata Conference + Hadoop World 2012: Azure HDInsight, Cloudera Impala, MapR M7


感谢马国耀对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2012-11-30 09:34930

评论

发布
暂无评论
发现更多内容

菊长说丨一文读懂MySQL4种事务隔离级别

华为云开发者联盟

MySQL 数据库 事务隔离级别 事务 华为云

Web 开发必须掌握的三个技术:Token、Cookie、Session

华为云开发者联盟

HTTP Token web开发 session Cookie

人生修炼秘籍

xiaoboey

时间管理 人生修炼 知行合一 熵增 时间复利

LeetCode题解:24. 两两交换链表中的节点,迭代,JavaScript,详细注释

Lee Chen

大前端 LeetCode

Google Protocol Buffer 学习笔记

半亩房顶

protobuf

SQL的三十而已—SQL30问

大唐小生

sql 技术人生

learn go with tests 学习笔记(三) 指针和错误

半亩房顶

Go 语言

秒懂云通信:如何使用阿里云号码认证服务(小白指南)

阿里云Edge Plus

云通信 通信云 号码认证

learn go with tests 学习笔记(四)依赖注入

半亩房顶

Go 语言

learn go with tests 学习笔记(六)进程同步

半亩房顶

Go 语言

ChaosBlade:从零开始的混沌工程(五)

郭旭东

Kubernetes 云原生 混沌工程

Jessie’s产品经理系列1-基础能力篇

架构5班杨娟Jessie

产品经理 能力模型

企业网站搭建避坑指南

姜奋斗

网站 新手指南 企业 网站搭建 避坑

字符串匹配 - Sunday算法

半亩房顶

数据结构与算法 字符串匹配算法

C/C++陷阱与套路,当年就是折在这些地儿…

华为云开发者联盟

c++ 设计 编辑 程序 陷阱

视频会议专线部署不会?别急,我教你

华为云开发者联盟

网络 网关 华为云 高清视频 welink

Java项目如何分层

老胡爱分享

分层架构 项目

Netty之旅:你想要的NIO知识点,这里都有!

一枝花算不算浪漫

Netty nio

learn go with tests 学习笔记(二) 数组与切片

半亩房顶

Go 语言

learn go with tests 学习笔记(五)并发

半亩房顶

Go 语言

1.2 了解MyBatis -《SSM深入解析与项目实战》

谙忆

七的婚姻生活

徐说科技

JVM系列之:再谈java中的safepoint

程序那些事

Java JVM JIT safepoint

InnoDB存储引擎简介

Simon

MySQL innodb

2.1 类加载器、 双亲委派模型 -《SSM深入解析与项目实战》

谙忆

微服务架构下你的数据一致了吗?

码猿外

架构 微服务 数据一致性

计算机网络基础(十五)---传输层-TCP协议详解

书旅

计算机网络 网络 协议栈 协议族

1.1 了解Spring框架 -《SSM深入解析与项目实战》

谙忆

操作系统和并发的爱恨纠葛

cxuan

Java 并发

CDN百科10:快速上手阿里云DCDN全站加速,最新配置与购买优惠教程

阿里云Edge Plus

CDN 直播 网页加速

learn go with tests 学习笔记(一) hello world

半亩房顶

Go 语言

O ' reilly阶层会议暨Hadoop世界2012:Azure HDInsight,Cloudera Impala,MapR M7_大数据_Boris Lublinsky_InfoQ精选文章