写点什么

Apache Storm 1.0 发布,带来性能提升和许多新特性

  • 2016-04-17
  • 本文字数:968 字

    阅读完需:约 3 分钟

1.0 版本是 Apache Storm 发展过程中一座重要的里程牌,负责 Apache Storm 项目的 Apache 软件基金会副总裁 P. Taylor Goetz 这样写道。该版本包含许多新特性和改进。尤其是,Goetz 声称它带来了3 到16 倍的性能提升。

Storm 是一个事件处理程序,可以对流数据进行分布式处理。一个 Storm 应用程序由“spouts”和“bolts”构成,它们被配置成一个有向无环图,用来表示信息源和数据处理程序。Storm 的主要特点是能处理实时数据,不像 Hadoop 那样允许批处理。

据 Goetz 介绍,与先前的版本相比,Storm 1.0 的性能最高提升了 16 倍,在大多数情况下预计都会有 3 倍的性能提升。特别地,性能的重大改善似乎来自下面的更改:

  • SpoutOutputCollector.emit()调用中使用 Java重新实现了Clojure reduce函数;
  • DisruptorQueue引入批处理,代替 spout 层的批处理,这以增加延迟为代价大幅提升了吞吐量。

特别地,雅虎工程师所做的大量的基准测试表明,与其他两个流行的分布式处理框架 Apache Flink Apache Spark 相比,性能历来是 Storm 的主要竞争优势之一。

此外,Storm 1.0 包含许多值得注意的新特性,例如:

  • Pacemaker:一个处理工作进程心跳的心跳守护进程,它常驻内存,提供了比 ZooKeeper 更好的性能;
  • 分布式缓存及相关 API:它允许在拓扑之间共享文件。文件可以随时更新,而不需要重新部署受影响的拓扑。这对于当前将资源文件包含在拓扑 jar 包中的做法是一种改进,这种做法更新文件时需要重新部署;
  • 高可用 Nimbus:使用一个 Nimbus 节点的动态集群代替单个 Nimbus 实例,如果当前的群首节点出现故障,就会选出新的“群首”;
  • 流窗口 API:新增窗口定义支持,这些窗口可以应用于数据处理,比如在最后一个小时里计算最热门的话题。以前,开发人员必须构建自己的窗口逻辑;
  • 自动反压:当任务缓冲区的大小达到了指定的限制(以百分比表示),Storm 就会自动降低拓扑 spouts 的速度;
  • 资源感知调度器:一种新的调度器实现,在将任务分配给最能满足特定需求的工作进程时考虑了集群中可用的内存和 CPU 资源;
  • 动态工作进程性能分析:旨在让用户可以从 Storm UI 获取工作进程性能数据,比如堆转储文件、JStack 输出。

读者可以从 GitHub 上下载 Apache Storm 1.0,或者从 Storm 下载页面上获取各种打包格式。

查看英文原文: Apache Storm Reaches 1.0, Brings Improved Performance, Many New Features

2016-04-17 19:004260
用户头像

发布了 1008 篇内容, 共 426.3 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

智洋创新与华为签署合作协议,共同推进昇腾AI产业持续发展

极客天地

玩转gRPC—深入概念与原理

闫同学

gRPC 网络协议 后端开发

使用 MyBatis 操作 Nebula Graph 的实践

NebulaGraph

mybatis 图数据库 Nebula Graph

在线文本行固定长度填充工具

入门小站

工具

在线SQL转Excel(xls/xlsx)工具

入门小站

工具

可视化任务编排&拖拉拽 | Scaleph 基于 Apache SeaTunnel的数据集成

Apache SeaTunnel

数据同步 数据集成 可视化开发 数据集成平台 拖拉拽

python小知识-python泛函数

AIWeker

Python python小知识 7月月更

实战模拟│JWT 登录认证

经验分享 JWT 开发语言 7月月更 跨域认证

托管式服务网络:云原生时代的应用体系架构进化

阿里巴巴云原生

阿里云 云原生 服务网格

赋能数字经济 福昕软件出席金砖国家可持续发展高层论坛

联营汇聚

应用实践 | 蜀海供应链基于 Apache Doris 的数据中台建设

SelectDB

数据库 数据中台 Apaache Doris

linux实战清理挖矿病毒kthreaddi

入门小站

Linux

一文掌握数仓中auto analyze的使用

华为云开发者联盟

数据库 sql 后端 analyze

上线首月,这家露营地游客好评率高达99.9%!他是怎么做到的?

天天预约

小程序 SaaS 线上预约 预约工具 露营

华为nova 10系列支持应用安全检测功能 筑牢手机安全防火墙

科技汇

基于Netty,徒手撸IM(一):IM系统设计篇

JackJiang

网络编程 Netty 即时通讯 im开发

DevEco Device Tool 3.0 Release带来5大能力升级,让智能设备开发更高效

HarmonyOS开发者

HarmonyOS

广电五舟与华为签署合作协议,共同推进昇腾AI产业持续发展

极客天地

整理混乱的头文件,我用include what you use

华为云开发者联盟

c++ 开发 C语言 技能

CANN算子:利用迭代器高效实现Tensor数据切割分块处理

华为云开发者联盟

人工智能 算子 迭代器

使用 BlocConsumer 同时构建响应式组件和监听状态

岛上码农

flutter ios 安卓 移动端开发 7月月更

HUAWEI nova 10系列发布 华为应用市场筑牢应用安全防火墙

最新动态

Nebula Importer 数据导入实践

NebulaGraph

图数据库 数据导入 Nebula Graph

“只跑一趟”,小区装维任务主动推荐探索

鲸品堂

运维

联想首次详解绿色智城数字孪生平台 破解城市双碳升级难点

科技大数据

解密函数计算异步任务能力之「任务的状态及生命周期管理」

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

扩展你的KUBECTL功能

mengzyou

Kubernetes DevOps kubectl krew

多模输入事件分发机制详解

OpenHarmony开发者

Open Harmony

湘江鲲鹏加入昇腾万里伙伴计划,与华为续写合作新篇章

极客天地

能源势动:电力行业的碳中和该如何实现?

脑极体

英特尔集成光电研究最新进展推动共封装光学和光互连技术进步

科技之家

Apache Storm 1.0发布,带来性能提升和许多新特性_语言 & 开发_Sergio De Simone_InfoQ精选文章