最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

Spark,Storm 和实时分析

  • 2014-06-19
  • 本文字数:746 字

    阅读完需:约 2 分钟

随着过去几年的信息量爆炸式增长,大数据分析一直在进步。 Hadoop 绝对是首选大数据分析和计算平台。随着数据卷,多样性和速度的增长,作为批处理框架的 Hadoop 已不能满足实时分析的要求。

Apache Spark 背后公司,Databricks 最近提出追加 1400 万美元加速 Spark 和 Shark 的研发。Spark 是用 Scala 写的大规模数据处理引擎,而 Shark 是 Spark 的 Hive 兼容变体。

同 Spark 类似,通过提供事件处理和分布式计算能力, Storm 目标也是改变 Hadoop 批处理特性。通过在有向图中设计拓扑变换,架构师可以完成任意的复杂计算,一次一个变换。

Nathan Marz 利用一线的经验,提出了 lambda 架构模式来解决这个基础架构问题。 Lambda 架构的体系结构包括一个服务层,它会从批处理层获取经常更新的信息,一个速度层,用于计算实时分析来弥补缓慢的批处理层。基本上,Hadoop 是以批进行计算分析,在批次之间的运行,速度层通过以流的形式检查事件来增量更新指标。

Spark 和 Storm 在 Hadoop 集群中进行操作,访问 Hadoop 存储。 Storm-YARN 是 Storm 和 Hadoop 融合体的雅虎开源实现。Spark 为 Hadoop 提供本地集成。Hadoop 集成是利用 YARN (NextGen MapReduce) 获得的。整合实时分析和基于 Hadoop 的系统,允许通过计算弹性更好地利用集群资源,在同一个集群意味着网络传输量最小。

在商业支持方面,Cloudera 已经宣布支持 Spark 和 CDH (Cloudera 包含 Apache Hadoop 的版本)。在 2014 上半年, hortonworks 计划在 HDP (hortonworks 数据平台)整合 Apache Storm。

查看英文原文: Spark, Storm and Real Time Analytics


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2014-06-19 07:538942

评论

发布
暂无评论
发现更多内容

香港VPS配置与应用:专家级建议与实践指南

一只扑棱蛾子

香港VPS

Footprint 的批量下载方案使交易回测更轻松

Footprint Analytics

区块链 回测

DAPP合约区块链技术项目系统开发

l8l259l3365

BetterMouse for Mac中文激活版下载(鼠标增强软件)

iMac小白

如何使用1688店铺所有商品API接口

Noah

Redis Desktop Manager for Mac(Redis桌面管理工具)中文激活版

Geek_幻墨成诗

RESP

iZotope RX 10 for mac v10.4.2 激活版

Geek_幻墨成诗

iZotope RX 10下载 iZotope RX 10破解版 iZotope RX 10 mac iZotope RX 10

WiFi7 IPQ9574-IPQ9554-QCN9274-QCN6274-space-time Block Code technology

wifi6-yiyi

ipq9574

上海统一运维管理平台推荐-行云管家

行云管家

IT运维 运维管理 统一运维

异常追踪与 JIRA 实现双向联动最佳实践

心有千千结

可观测性 Jira

全力备战中国大学生计算机设计大赛!历年获奖作品正式上线和鲸社区

ModelWhale

Python 云计算 算法 数据分析 中国大学生计算机设计大赛

MindNode 5 for Mac(思维导图) v5.0.1中文激活版

mac

思维导图软件 苹果mac Windows软件 MindNode 5

3D场景建模工具

3D建模设计

在线工具 3D场景建模 数字孪生场景

用行云管家实现IT统一运维管理,提高运维效率

行云管家

IT运维 行云管家 运维管理 统一运维

软件测试/人工智能|LangChain核心模块Agents详解

霍格沃兹测试开发学社

软件测试/人工智能|为什么Python在人工智能时代异军突起

霍格沃兹测试开发学社

低代码开发可以解决哪些问题?

代码生成器研究

NUKE 14 for mac(电影特效合成软件) v14.0v5中文激活版

mac

苹果mac Windows软件 NUKE 14 电影特效合成软件

uniapp开发App从开发到上架全过程

雪奈椰子

Android 实现APP可切换多语言

EquatorCoco

APP开发 Andriod开发

软件测试/人工智能|一文告诉你LangChain核心模块chains原理

霍格沃兹测试开发学社

「智造」第10期:浅谈工业互联网加速企业服务化转型

用友BIP

智能制造

速速报名!请查收 2023 龙蜥操作系统大会超全指南

OpenAnolis小助手

开源 龙蜥社区 北京 2023龙蜥操作系统大会

3d模型的中心原点有偏移怎么办?

3D建模设计

3d建模 模型原点设置

通过1688店铺所有商品API接口一键获取店铺所有商品信息

Noah

次世代建模纹理贴图怎么做?

3D建模设计

3D渲染 材质贴图 模型纹理

Java 实现 MySQL 数据锁定策略

秃头小帅oi

JavaScript中的异步处理方法,

互联网工科生

JavaScript 异步处理

生成式AI与预测式AI的主要区别与实际应用

高端章鱼哥

生成式AI 预测式AI

Last Week in Milvus

Zilliz

非结构化数据 Milvus Zilliz AIGC 向量数据库

都2023年了,你还不会 CI/CD 吗?

伤感汤姆布利柏

ci CD

Spark,Storm和实时分析_DevOps & 平台工程_Alex Giamas_InfoQ精选文章