GMTC全球大前端技术大会(北京站)门票9折特惠截至本周五,点击立减¥480 了解详情
写点什么

Cloudera Distribution Containing Apache Hadoop 5 概述

2014 年 4 月 23 日

近日,Cloudera 发布了最新的软件发行版 CDH5 。此次发布距离上一个主要版本发布将近 20 个月了, CDH4 似乎已经在 Big Data 世界里存在了好多年。

在从包括英特尔和谷歌风投在内的投资公司那里获得了9 亿美元的资金后,Cloudera 正全速发展,将Hadoop 从一个面向数据科学家的利基工具转成一个存储和处理所有数据的集中地。按Tim Stevens 的说法 Cloudera Enterprise 5 “是一个真正的企业级数据中心”。

Cloudera Enterprise 5 包含 CDH5、Cloudera Manager 5 和 Cloudera Navigator ,其中 Cloudera Navigator 是一款面向 Big Data 数据管理方面的工具。

CDH5 的主要特点是使用 YARN 提供了可用于生产环境的 MR2。Cloudera Manager 也支持 MR2,而且 CDH5 还向后兼容 MR1。不过,Cloudera建议将YARN 和CDH5 一起使用。使用YARN,用户可以并行运行SQL、MapReduce 和Spark 工作负载,而且可以获得更好的整体资源利用率。

现在, Apache Spark 包含在 CDH5 中。Cloudera 宣称,使用 Spark,作业的部分或全部阶段都是在内存中运行,作业执行速度快 5 到 100 倍。最近,Spark 从 Apache 孵化器毕业,在整个2013 年发展势头强劲,有超过100 名贡献者为项目提供帮助。将Spark 集成进CDH5 可以扩展Hadoop 的用途,使其不局限于批处理,还可用于实时分析。除Cloudera 之外,MapR 最近也宣布在面向Apache Hadoop 的MapR 发行版中支持整个 Spark 技术栈

有了 CDH5,SQL 查询现在通过 Cloudera Impala 以及 Hive 包含在 CDH 中。SQL 支持的特性差异可能正是这两种解决方案的独特之处。

Cloudera 搜索集成进 CDH5,这也意味着任何文件或对象都可以近乎实时地索引和搜索。该功能基于 Apache Solr ,尽管其目的不是成为一个通用的搜索解决方案,但它提供了面向 CDH 中所有数据的全文搜索功能。

Cloudera Enterprise 5 可以集成超过 100 款合作伙伴产品,这有助于将CDH 数据集与流行的预测分析工具集成。数据科学家可以使用他们最喜欢的工具,如SAS 或Revolution Analytics,而且工程开销更小。

此外,它还包含完备的灾难恢复、自动备份与还原工具以及更好的访问控制。Cloudera 将IBM 和Pivotal 看作其主要竞争对手,而不是Hortonworks 和MapR,企业数据中心是其努力的中心。

查看英文原文:**** A Roundup of Cloudera Distribution Containing Apache Hadoop 5

2014 年 4 月 23 日 04:241557
用户头像

发布了 256 篇内容, 共 68.3 次阅读, 收获喜欢 6 次。

关注

评论

发布
暂无评论
发现更多内容

NeoKylin-Server-5.0离线部署etcd+flannel集群,实现docker容器跨主机网络通信

星河寒水

Docker etcd flannel 麒麟操作系统 离线部署

产业互联网业务与团队的思考

陈俊

半导体芯片小白基础知识(2) (28天写作 Day23/28)

mtfelix

集成电路 28天写作 晶圆 光刻机 晶圆代工

架构师训练营第 2 期 第 7 周 作业一

老坛酸菜

架构师训练营第2期

Java开发工作4年还是只会“增删改查”,Java程序员该如何进阶?

Java成神之路

Java 程序员 架构 面试 编程语言

谁,是产品的利益相关方?

不离

极客大学认识产品经理 极客大学产品经理训练营 跟着二爷学产品

刚面完阿里Java高级岗拿到40K的offer,这些技术你必须要掌握!

Java成神之路

Java 程序员 架构 面试 编程语言

Alibaba2020年度内部全技术栈PPT总结(基础+架构+算法+大数据+手册)

Java成神之路

Java 程序员 架构 面试 编程语言

Java学习笔记整理:Spring+tomcat+Kafka+多线程面试笔记

Java架构之路

Java 程序员 架构 面试 编程语言

Mybatis【16】-- Mybatis多对一关联查询

秦怀杂货店

数据库 mybatis

软件教练说:性能优化与性能设计,“相亲相爱”的一对

华为云开发者社区

架构 性能优化 设计 程序 软件教练

2021年春招,Java后端最全面试攻略,吃透25个技术栈

Crud的程序员

Java 程序员 架构

jdk8 String和StringBuilder对象创建所在位置

ilovealt

Java string StringBuilder

奇葩java迭代器笔试题,做对算你厉害

田维常

迭代器模式

蚂蚁金服二面被血虐,鬼知道面试的我经历了什么?

Java架构之路

Java 程序员 架构 面试 编程语言

学习JAVA8个月,成功跳槽,外包进阿里成功定级P7,太牛了!

云流

Java 编程 程序员 面试

产品经理训练营笔记-产品思维和产品意识(下)

.nil?

产品经理训练营

30+程序员竞争力从哪里来?

我心依然

竞争力 大龄程序员

真狠!涵盖了Netty+Spark+Hadoop+分布式五部分!讲的清清楚楚!

996小迁

redis hadoop 架构 面试 Netty

阿里一线架构师甩出“源码阅读指南”,从源码到实战,一键搞定

比伯

Java 编程 程序员 架构 计算机

成长篇-结构思考力笔记(完整版)

小诚信驿站

程序员 刘晓成 小诚信驿站 成长笔记 28天写作

JVM笔记 -- Java跨平台和JVM跨语言

秦怀杂货店

JVM JVM笔记

九大核心专题,630页内容,熬夜23天吃透,我收割了3个大厂offer

周老师

Java 编程 程序员 架构 面试

全网最全:Java9全部新特性一览

程序员小毕

Java 编程 程序员 架构 JVM

老外程序员的Java性能优化方式是什么?JVM调优策略+工具+技巧

Java架构追梦

Java 学习 架构 面试 jvm调优

凭借这份Github上55.3K面试指南,我成功拿到Google、阿里的offer

Java成神之路

Java 程序员 架构 面试 编程语言

BAT面试Spring全家桶:Spring+SpringBoot+SpringCloud+SpringMVC

Java架构之路

Java 程序员 架构 面试 编程语言

区块链人才能力评价测试机构亮相

CECBC区块链专委会

区块链人才

面试官问:ZooKeeper是强一致的吗?怎么实现的?

云流

Java 编程 程序员 面试 分布式

一名开发三年的Java程序员陈述:进大公司拿30K+到底有多难?

Java成神之路

Java 程序员 架构 面试 编程语言

《小狗钱钱》读书笔记

架构精进之路

读书笔记 七日更 28天写作

Cloudera Distribution Containing Apache Hadoop 5概述-InfoQ