写点什么

Spark,Storm 和实时分析

  • 2014-06-19
  • 本文字数:746 字

    阅读完需:约 2 分钟

随着过去几年的信息量爆炸式增长,大数据分析一直在进步。 Hadoop 绝对是首选大数据分析和计算平台。随着数据卷,多样性和速度的增长,作为批处理框架的 Hadoop 已不能满足实时分析的要求。

Apache Spark 背后公司,Databricks 最近提出追加 1400 万美元加速 Spark 和 Shark 的研发。Spark 是用 Scala 写的大规模数据处理引擎,而 Shark 是 Spark 的 Hive 兼容变体。

同 Spark 类似,通过提供事件处理和分布式计算能力, Storm 目标也是改变 Hadoop 批处理特性。通过在有向图中设计拓扑变换,架构师可以完成任意的复杂计算,一次一个变换。

Nathan Marz 利用一线的经验,提出了 lambda 架构模式来解决这个基础架构问题。 Lambda 架构的体系结构包括一个服务层,它会从批处理层获取经常更新的信息,一个速度层,用于计算实时分析来弥补缓慢的批处理层。基本上,Hadoop 是以批进行计算分析,在批次之间的运行,速度层通过以流的形式检查事件来增量更新指标。

Spark 和 Storm 在 Hadoop 集群中进行操作,访问 Hadoop 存储。 Storm-YARN 是 Storm 和 Hadoop 融合体的雅虎开源实现。Spark 为 Hadoop 提供本地集成。Hadoop 集成是利用 YARN (NextGen MapReduce) 获得的。整合实时分析和基于 Hadoop 的系统,允许通过计算弹性更好地利用集群资源,在同一个集群意味着网络传输量最小。

在商业支持方面,Cloudera 已经宣布支持 Spark 和 CDH (Cloudera 包含 Apache Hadoop 的版本)。在 2014 上半年, hortonworks 计划在 HDP (hortonworks 数据平台)整合 Apache Storm。

查看英文原文: Spark, Storm and Real Time Analytics


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-06-19 07:539427

评论

发布
暂无评论
发现更多内容

数据报告 | 2022年双十一变化趋势分析报告

前嗅大数据

双十一 数据报告 电商报告

数据分析的步骤

穿过生命散发芬芳

数据分析 11月月更

Java Web(四)JS

浅辄

javaWeb JavaScrip 11月月更

EventBridge助力阿里云视觉智能开放平台AI智能存储实践

Apache RocketMQ

AI 消息队列 EventBridge

科普|什么是元宇宙

NFT Research

区块链 NFT 元宇宙

【C语言】else 语句

謓泽

11月月更

Apache Doris 1.1.4 版本正式发布!

SelectDB

数据库 大数据 数据仓库 Doris LTS

RocketMQ 在物流行业的应用与运维

Apache RocketMQ

RocketMQ 消息队列 Apache RocketMQ

用python写一个时钟模型

乔乔

11月月更

专访吴静涛丨从未有人把金融信创挑战说的这么透彻!

通明湖

洞见科技中标安康市数据要素流通平台(隐私计算平台)建设项目

洞见科技

前端培训学习后就业前景怎么样

小谷哥

北京前端培训怎么去学习

小谷哥

几分钟实现对恶意IP地址进行拦截,腾讯云Web防火墙实在太香了!

wljslmz

腾讯云 Web应用防火墙 黑名单 11月月更

实践竞争力第一!洞见科技获评艾瑞咨询隐私计算金融市场「综合领导者」

洞见科技

大数据培训怎么选择,就业还大不大

小谷哥

应用发布新版本如何保障流量无损

阿里巴巴云原生

阿里云 微服务 云原生

模块五-作业

Weldon

架构实战营

什么是区块链Dapp智能合约系统开发?

W13902449729

区块链 dapp开发

AI音乐创作,让每一个人都成为音乐家

叶落便知秋

泛型由入门到精通

好程序员IT教育

一篇文章彻底理解数据库的各种超时参数

明哥的IT随笔

数据库 JDBC

Sentinel

苏格拉格拉

分布式 微服务 sentinel 熔断 限流

大数据培训学习前景如何

小谷哥

【spring-kafka】@KafkaListener详解与使用

石臻臻的杂货铺

kafka 11月月更

区块链基础知识介绍及dapp简单介绍

W13902449729

区块链 dapp

创建一个科学决策必备的A/B实验,都需要哪些准备?——火山引擎 DataTester 使用指南

字节跳动数据平台

大数据 A/B测试

洞见科技中标浙江农商联合银行「隐私计算平台」项目

洞见科技

阿里云研究员马涛:龙蜥社区做对了两件事

云布道师

开源 云栖大会 龙蜥社区

昇腾AI异构计算架构CANN 6.0全新开放升级,全面释放AI生产力

极客天地

KUMU×微帧科技,为菲律宾独角兽提供编码API服务

微帧Visionular

Spark,Storm和实时分析_DevOps & 平台工程_Alex Giamas_InfoQ精选文章