写点什么

11 天里 13 个 Apache 开源项目宣布退休,Hadoop 的时代结束了

  • 2021-05-18
  • 本文字数:1533 字

    阅读完需:约 5 分钟

11天里13个Apache开源项目宣布退休,Hadoop的时代结束了

在 11 天之内,Apache 宣布退役了 13 个与大数据相关的 Apache 项目,其中包括 Sentry、Tajo 和 Falcon。看起来 Hadoop 和大数据的黄金年代已经正式结束。</preface>


曾几何时,Apache Hadoop 是大数据的代表,但今天谁都知道它已经过时了。而自 4 月 1 日起,Apache 软件基金会(ASF)宣布将至少 19 个开源项目撤回到他们的“Attic”,其中 13 个与大数据相关,10 个属于 Hadoop 生态系统。

光荣榜


单个项目的退役公告可能不算什么,但它们加在一起足以成为一个分水岭。


为了帮助从业者和行业观察者充分认识到这次大数据开源项目洗牌的深刻影响,我们应该好好整理一下。


与大数据相关的 Apache 退役项目包括:


  • Apex:基于 HadoopYARN 的统一大数据流和批处理平台

  • Chukwa:基于 Hadoop 分布式文件系统(HDFS)构建的,用于监视大型分布式系统的数据收集系统

  • Crunch,提供了用于编写、测试和运行 MapReduce(包括 HadoopMapReduce)管道的框架

  • Eagle:一种分析解决方案,可在包括 Hadoop 在内的大数据平台上迅速识别安全和性能问题

  • Falcon:针对 Hadoop 的数据处理和管理解决方案,设计用于数据移动、数据管道协调、生命周期管理和数据发现

  • Hama:一种用于大数据分析的框架,运行在 Hadoop 上,并且基于 BulkSynchronousParallel 范式

  • Lens,提供了统一的分析界面,将 Hadoop 与传统数据仓库深度集成在一起

  • Marmotta:链接数据的开放平台

  • Metron:专注于实时大数据安全性

  • PredictionIO:一种用于管理和部署生产就绪的预测服务的机器学习服务器

  • Sentry:一种用于对 ApacheHadoop 中的数据和元数据执行细粒度授权的系统

  • Tajo:Hadoop 上的大数据仓库系统

  • Twill,它使用 HadoopYARN 的分布式功能和类似的编程模型来运行线程

房间里的“大象”


上面这个列表很长,而完整的列表还包括一些非大数据项目。显然,ASF 正在做一些内部清扫工作。此外,由于 Cloudera-Hortonworks 的合并,与 Ranger 和 Spot 项目竞争的 Sentry 和 Metron 也被弃用。之前两家公司总共支持四个项目,现在只保留两个就够了。


这次合并的背景是大数据市场的整合趋势。而且可以说,这场大数据整合潮流也是上面这些项目“退役”的根本原因。至少可以说,在不到两周的时间内宣布所有这些项目“退役”的确是一件大事。

官方评论


我向 ASF 询问了他们清理大数据项目的解释。ASF 市场营销与宣传副总裁 Sally Khudairi 通过电子邮件回复说:“Apache 项目活动在生命周期中往往会起伏不定,这取决于社区的参与。”Khudairi 补充说:“我们……从项目管理委员会(PMC)到董事会内部,对多个 Apache 项目的活动进行了审查和评估,并投票决定将这些项目退回到 Attic。”Khudairi 还说,ASF 的 Apache Attic 副总裁 Hervé Boutemy“最近非常高效地完成了“春季大扫除”,妥善处理了在过去几个月中准备退役的十几个项目。”


尽管 ASF 断言这次大数据清理工作只是其他常规项目退役的一部分,但很明显,大数据领域的情况已经发生了变化。Hadoop 在开源分析技术的主导地位已让给 Spark,Hortonworks 和老牌的 Cloudera 之间的相似项目无意义竞争也结束了,这些项目完成了达尔文自然选择过程。

小心一点吧


很明显,在大数据世界中,大量投资于 Apache Sentry 的供应商和客户现在需要整理他们的损失并继续前进。残酷的现实带来的教训几乎适用于所有技术炒作周期:社区开始兴奋起来,开源技术激增,生态系统逐渐完善。但这些生态系统并不会永存,几乎任何新平台(无论是商业平台还是开源平台)都存在固有的风险。


用 ASF 的 Khudairi 的话来说:“每个项目背后的社区才是代码生命力的源泉('代码不会自动编写出来'),因此社区改变项目步伐的情况并不少见。”换句话说,尖端技术令人兴奋,但早期采用者要小心:它也是很脆弱的。请多加注意,并妥善管理风险。


原文链接:


https://www.zdnet.com/article/apache-software-foundation-retires-slew-of-hadoop-related-projects/


2021-05-18 10:0012467
用户头像
刘燕 InfoQ高级技术编辑

发布了 1123 篇内容, 共 608.4 次阅读, 收获喜欢 1982 次。

关注

评论 7 条评论

发布
用户头像
标题的确有点吸引眼球,实际没有那么简单被取代。产品化和计算组件的替换倒是有可能,存储调度还是用hadoop那套
2021-06-01 00:25
回复
用户头像
标题党的水平都是比较低的
2021-05-26 17:24
回复
用户头像
博眼球的标题。。。。
2021-05-26 16:10
回复
用户头像
Hadoop 被取代了?
2021-05-18 14:15
回复
现在很多大数据项目底层存储依然使用hadoop hdfs. 文中提到主导地位hadoop让给了spark等,可能说的只是计算层。随着一些大数据产品如CDH的推出和不断完善,搭建大数据平台不再需要一个组件一个组件的搭了,越来越像使用一个完整的产品一样使用。但hdfs等底层技术组件依然存在。
2021-05-18 14:33
回复
所以文章想表达的意思应该是大数据平台已经从传统手撸到整体一站式产品化了。使用Hadoop要怎么怎么的标题,有博眼球之嫌
2021-05-18 14:38
回复
其实spark只是计算组件,hadoop除了计算还有很多。比如复杂的分布式文件hdfs,几乎都在用
2021-06-01 00:23
回复
没有更多了
发现更多内容

被催了1年多,我终于把IDEA版本的FlinkSQL插件撸好了

泊浮目

flink 实战 FlinkSQL 数据库 大数据

从零开始搭建智能问答系统?KoalaQA 让你轻松实现 AI 客服自由

百川云开发者

开源 只能售后

从拉丝到出库,全程透明:专为漆包线打造的智能制造解决方案

万界星空科技

mes 漆包线mes 电线电缆mes 漆包线工厂 铜杆加工mes

6000字技术向拆解 “大晓机器人”携手火山引擎多模态数据湖探索视频处理新路径

字节跳动数据平台

多模态数据湖

【案例共创】基于华为开发者空间的RestNet50目标检测

华为云开发者联盟

人工智能 算法 #开发者空间

突破35岁+非科班天花板,人工智能测试开发助我拿下大厂50W+ Offer

测试人

人工智能 软件测试

数字藏品 NFT 项目的核心技术

北京木奇移动技术有限公司

NFT 数字藏品 软件外包公司

BOE(京东方)亮相联合国可持续企业家论坛 共推全球“可持续品牌标准”建设

爱极客侠

12 月 24 日(周三)20:00,《斯坦福大学人生设计课》共读分享

ShineScrum

读书感悟 #读书 读书总结

Comate强力赋能:「趣绘像素岛」从体验泥潭到高性能可用的蜕变之路

Comate编码助手

Baidu Comate AI 编程 文心快码 AI编程助手

云监控 2.0 日志审计:打破云端安全审计的数据壁垒,UModel 实体建模是关键!

阿里巴巴云原生

阿里云 云原生 云监控 可观测 日志审计

【案例共创】线性回归 - 汽车行驶里程与油耗关系预测

华为云开发者联盟

人工智能 机器学习 算法 #华为开发者空间

AI教学演示系统开发:让技术真正服务课堂

上海拔俗

AI数字化修理管理系统开发:让维修效率与管控精度双提升

上海拔俗

【Jeecg OA实战】门户设计全新上线,支持PC与移动端自适应,提升协同办公效率

JEECG低代码

低代码 JeecgBoot jeecg AI低代码平台 门户设计

Java 设计模式:原理、框架应用与实战全解析|得物技术

得物技术

Java、 java 架构

企业人员安全意识|双轨并行:多维培训活动筑牢安全思维

百度安全

网络安全 企业安全 安全防护

绿电直连系统安全防护技术:网络安全、运行安全与数据安全的全维度保障

西格电力

#数据 绿电直连 绿色能源与可持续发展 源网荷储 绿电直连管理系统

人形机器人的2025:离“进家门”还有多远?

Alter

上海疾控携手浪潮云海入选中国信通院2025“一云多芯”创新应用实践

科技经济

dapp 开发中,如何避免 gas 费过高的问题?

西安链酷科技

1688商品快递费用API开发指南

Datafox(数据狐)

1688API 1688快递费用接口 1688运费接口 1688商品快递费用API 1688运费api

Kiro小应用开发:设计和实现隐私号码

亚马逊云科技 (Amazon Web Services)

人工智能

公链拥堵时,dapp 如何保障交易速度?

西安链酷科技

行业标杆 | 越秀地产入选「2025年度数据湖仓应用创新先锋企业」

镜舟科技

实时数据分析 StarRocks 镜舟科技 数据湖仓 越秀地产

钱包助记词丢失,还有办法找回资产吗?

西安链酷科技

AI数字化修理管理系统开发:让维修效率与管控精度双提升

上海拔俗

数字藏品(NFT)系统的开发

北京木奇移动技术有限公司

NFT 数字藏品 软件外包公司

数据编织-异构数据存储的自动化治理

数由科技

人工智能 自动化 数据治理 数据科学 数据编织

Meta 发布 SAM Audio:首个统一多模态音频分离模型,准实时处理;深圳地铁试点导盲机器人丨日报

RTE开发者社区

AI模拟练习系统开发:让练习精准匹配学习需求

上海拔俗

11天里13个Apache开源项目宣布退休,Hadoop的时代结束了_大数据_Andrew Brust_InfoQ精选文章