写点什么

Spark,Storm 和实时分析

  • 2014-06-19
  • 本文字数:746 字

    阅读完需:约 2 分钟

随着过去几年的信息量爆炸式增长,大数据分析一直在进步。 Hadoop 绝对是首选大数据分析和计算平台。随着数据卷,多样性和速度的增长,作为批处理框架的 Hadoop 已不能满足实时分析的要求。

Apache Spark 背后公司,Databricks 最近提出追加 1400 万美元加速 Spark 和 Shark 的研发。Spark 是用 Scala 写的大规模数据处理引擎,而 Shark 是 Spark 的 Hive 兼容变体。

同 Spark 类似,通过提供事件处理和分布式计算能力, Storm 目标也是改变 Hadoop 批处理特性。通过在有向图中设计拓扑变换,架构师可以完成任意的复杂计算,一次一个变换。

Nathan Marz 利用一线的经验,提出了 lambda 架构模式来解决这个基础架构问题。 Lambda 架构的体系结构包括一个服务层,它会从批处理层获取经常更新的信息,一个速度层,用于计算实时分析来弥补缓慢的批处理层。基本上,Hadoop 是以批进行计算分析,在批次之间的运行,速度层通过以流的形式检查事件来增量更新指标。

Spark 和 Storm 在 Hadoop 集群中进行操作,访问 Hadoop 存储。 Storm-YARN 是 Storm 和 Hadoop 融合体的雅虎开源实现。Spark 为 Hadoop 提供本地集成。Hadoop 集成是利用 YARN (NextGen MapReduce) 获得的。整合实时分析和基于 Hadoop 的系统,允许通过计算弹性更好地利用集群资源,在同一个集群意味着网络传输量最小。

在商业支持方面,Cloudera 已经宣布支持 Spark 和 CDH (Cloudera 包含 Apache Hadoop 的版本)。在 2014 上半年, hortonworks 计划在 HDP (hortonworks 数据平台)整合 Apache Storm。

查看英文原文: Spark, Storm and Real Time Analytics


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-06-19 07:539361

评论

发布
暂无评论
发现更多内容

小棉袄,最终却没有变成你的防弹衣

小天同学

个人成长 成长 感悟 母亲节 感恩

高仿瑞幸小程序 05 更正轮播组件的高度计算

曾伟@喵先森

小程序 微信小程序 大前端

软件产品开发流程

Interstate5

软件开发 软件开发流程

面向对象是什么

落英亭郎

面向对象

HTTP 升级 HTTPS 全过程记录

猴哥一一 cium

https 证书

人人都应该懂的加密算法 - 公钥加密

麦叔

对称加密 加密解密 信息安全 公钥加密

《如何阅读一本书》读书心得

兆熊

读书笔记

程序员的晚餐 | 5月9日 炖蹄髈

清远

程序员

软件产品信息安全 - 数据分类

Interstate5

软件开发 信息安全 数据分类

大话区块链和比特币的技术原理

麦叔

比特币 区块链 数字货币 加密货币 加密解密

Android Studio NDK 编译 Bsdiff 库

码农亮哥

android-studio ndk bsdiff

《零基础学 Java》 FAQ 之 3-为什么计算机里的浮点数不精确

臧萌

Java 浮点数

给在线教学泼点冷水

启润

在线教育 基础教育

一口气带你踩完五个 List 的大坑,真的是处处坑啊!

楼下小黑哥

Java 踩坑 后端 集合

Redis学习笔记(集合类型)

编程随想曲

redis

Spring整合MyBatis详细分析

Java收录阁

mybatis

LeetCode 1232. Check If It Is a Straight Line

liu_liu

LeetCode

《零基础学Java》 FAQ 之 零-这门课适合我吗?

臧萌

Java 编程语言

程序员必需清楚的进程和线程

小趴菜~

线程 操作系统 进程

产品周刊 | 第 14 期(20200510)

八味阁

产品 产品经理 产品设计

模块化设计思想产品设计应用

燕陈华

产品设计 模块化流程 流程图

从nacos客户端的TIME_WAIT说起

捉虫大师

Java TCP nacos

webpack入门(一)

子铭

《零基础学 Java》 FAQ 之 4-关于补码,多说两句

臧萌

Java 补码

权威与边界

伯薇

权威 边界 BART 工作方式

软件产品的信息安全问题

Interstate5

软件开发 信息安全

Java小想法: JDK许可证

X.F

Java 编程语言

白话计算机网络通信过程

WB

程序员 计算机网络

Java内存模型和volatile、final等关键字

麻瓜镇

Java 多线程

用 Electron 打包语雀

封不羁

Java Electron

《你好架构师之 压榨硬件价值的利器容器(Docker)》

再见小飞侠

Spark,Storm和实时分析_DevOps & 平台工程_Alex Giamas_InfoQ精选文章