2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

11 天里 13 个 Apache 开源项目宣布退休,Hadoop 的时代结束了

  • 2021-05-18
  • 本文字数:1533 字

    阅读完需:约 5 分钟

11天里13个Apache开源项目宣布退休,Hadoop的时代结束了

在 11 天之内,Apache 宣布退役了 13 个与大数据相关的 Apache 项目,其中包括 Sentry、Tajo 和 Falcon。看起来 Hadoop 和大数据的黄金年代已经正式结束。</preface>


曾几何时,Apache Hadoop 是大数据的代表,但今天谁都知道它已经过时了。而自 4 月 1 日起,Apache 软件基金会(ASF)宣布将至少 19 个开源项目撤回到他们的“Attic”,其中 13 个与大数据相关,10 个属于 Hadoop 生态系统。

光荣榜


单个项目的退役公告可能不算什么,但它们加在一起足以成为一个分水岭。


为了帮助从业者和行业观察者充分认识到这次大数据开源项目洗牌的深刻影响,我们应该好好整理一下。


与大数据相关的 Apache 退役项目包括:


  • Apex:基于 HadoopYARN 的统一大数据流和批处理平台

  • Chukwa:基于 Hadoop 分布式文件系统(HDFS)构建的,用于监视大型分布式系统的数据收集系统

  • Crunch,提供了用于编写、测试和运行 MapReduce(包括 HadoopMapReduce)管道的框架

  • Eagle:一种分析解决方案,可在包括 Hadoop 在内的大数据平台上迅速识别安全和性能问题

  • Falcon:针对 Hadoop 的数据处理和管理解决方案,设计用于数据移动、数据管道协调、生命周期管理和数据发现

  • Hama:一种用于大数据分析的框架,运行在 Hadoop 上,并且基于 BulkSynchronousParallel 范式

  • Lens,提供了统一的分析界面,将 Hadoop 与传统数据仓库深度集成在一起

  • Marmotta:链接数据的开放平台

  • Metron:专注于实时大数据安全性

  • PredictionIO:一种用于管理和部署生产就绪的预测服务的机器学习服务器

  • Sentry:一种用于对 ApacheHadoop 中的数据和元数据执行细粒度授权的系统

  • Tajo:Hadoop 上的大数据仓库系统

  • Twill,它使用 HadoopYARN 的分布式功能和类似的编程模型来运行线程

房间里的“大象”


上面这个列表很长,而完整的列表还包括一些非大数据项目。显然,ASF 正在做一些内部清扫工作。此外,由于 Cloudera-Hortonworks 的合并,与 Ranger 和 Spot 项目竞争的 Sentry 和 Metron 也被弃用。之前两家公司总共支持四个项目,现在只保留两个就够了。


这次合并的背景是大数据市场的整合趋势。而且可以说,这场大数据整合潮流也是上面这些项目“退役”的根本原因。至少可以说,在不到两周的时间内宣布所有这些项目“退役”的确是一件大事。

官方评论


我向 ASF 询问了他们清理大数据项目的解释。ASF 市场营销与宣传副总裁 Sally Khudairi 通过电子邮件回复说:“Apache 项目活动在生命周期中往往会起伏不定,这取决于社区的参与。”Khudairi 补充说:“我们……从项目管理委员会(PMC)到董事会内部,对多个 Apache 项目的活动进行了审查和评估,并投票决定将这些项目退回到 Attic。”Khudairi 还说,ASF 的 Apache Attic 副总裁 Hervé Boutemy“最近非常高效地完成了“春季大扫除”,妥善处理了在过去几个月中准备退役的十几个项目。”


尽管 ASF 断言这次大数据清理工作只是其他常规项目退役的一部分,但很明显,大数据领域的情况已经发生了变化。Hadoop 在开源分析技术的主导地位已让给 Spark,Hortonworks 和老牌的 Cloudera 之间的相似项目无意义竞争也结束了,这些项目完成了达尔文自然选择过程。

小心一点吧


很明显,在大数据世界中,大量投资于 Apache Sentry 的供应商和客户现在需要整理他们的损失并继续前进。残酷的现实带来的教训几乎适用于所有技术炒作周期:社区开始兴奋起来,开源技术激增,生态系统逐渐完善。但这些生态系统并不会永存,几乎任何新平台(无论是商业平台还是开源平台)都存在固有的风险。


用 ASF 的 Khudairi 的话来说:“每个项目背后的社区才是代码生命力的源泉('代码不会自动编写出来'),因此社区改变项目步伐的情况并不少见。”换句话说,尖端技术令人兴奋,但早期采用者要小心:它也是很脆弱的。请多加注意,并妥善管理风险。


原文链接:


https://www.zdnet.com/article/apache-software-foundation-retires-slew-of-hadoop-related-projects/


2021-05-18 10:0012448
用户头像
刘燕 InfoQ高级技术编辑

发布了 1123 篇内容, 共 606.4 次阅读, 收获喜欢 1982 次。

关注

评论 7 条评论

发布
用户头像
标题的确有点吸引眼球,实际没有那么简单被取代。产品化和计算组件的替换倒是有可能,存储调度还是用hadoop那套
2021-06-01 00:25
回复
用户头像
标题党的水平都是比较低的
2021-05-26 17:24
回复
用户头像
博眼球的标题。。。。
2021-05-26 16:10
回复
用户头像
Hadoop 被取代了?
2021-05-18 14:15
回复
现在很多大数据项目底层存储依然使用hadoop hdfs. 文中提到主导地位hadoop让给了spark等,可能说的只是计算层。随着一些大数据产品如CDH的推出和不断完善,搭建大数据平台不再需要一个组件一个组件的搭了,越来越像使用一个完整的产品一样使用。但hdfs等底层技术组件依然存在。
2021-05-18 14:33
回复
所以文章想表达的意思应该是大数据平台已经从传统手撸到整体一站式产品化了。使用Hadoop要怎么怎么的标题,有博眼球之嫌
2021-05-18 14:38
回复
其实spark只是计算组件,hadoop除了计算还有很多。比如复杂的分布式文件hdfs,几乎都在用
2021-06-01 00:23
回复
没有更多了
发现更多内容

打造多模态交互新范式|彩讯股份中标2025年中国移动和留言平台AI智能体研发项目

彩讯股份300634

英特尔推进技术创新,以规模更大的封装满足AI应用需求

E科讯

KubeCon China 2025 | 与KubeEdge畅聊毕业经验与创新未来

华为云原生团队

云计算 容器 云原生

扎根业务,这个618商业智能体先跑起来

脑极体

AI

假如给你1亿的Redis key,如何高效统计?

不在线第一只蜗牛

数据库 redis

揭秘:AI Agent落地难在哪,产品又咋样?

Techinsight

智能体 AI 智能体

你了解Java线程池原理吗?

不在线第一只蜗牛

Java 算法

西南会议 | 2025 Altair 区域技术交流会即将在成都盛大举行!

Altair RapidMiner

人工智能 AI HPC 数字孪生 CAE

一体系数据平台的进化:基于阿里云 EMR Serverless Spark的持续演进

阿里云大数据AI技术

云计算 Serverless 数据分析 数据处理 数据库 大数据

等保测评:差距测评

等保测评

Dify实战案例:MySQL查询助手!嘎嘎好用

王磊

通义灵码带你玩转 MCP 最佳实践(合辑,持续更新中)

阿里巴巴云原生

通义灵码 MCP

技术视角:AI Agent 落地局限与产品实现

Techinsight

智能体 Agents AI 智能体 智能体评估

五分钟搭建属于你的AI助手:Ollama+DeepSeek+AnythingLLM深度整合教程

量贩潮汐·WholesaleTide

人工智能 DeepSeek

商品中心—B端建品和C端缓存的技术文档(二)

电子尖叫食人鱼

架构

三类不同身份的“开发者”,在昇腾CANN的土壤上种下了繁荣之花

Alter

鸿蒙 NEXT 应用签名机制有何变化?如何生成并配置签名证书?

巴库一郎

鸿蒙 开发工具 HarmonyOS HarmonyOS NEXT 实践分享

亚马逊宣布投资100亿美元在北卡罗来纳州建设数据中心以支持AI扩展

PowerVerse

人工智能 AI 数据 去中心化云算力

全议程硬核公布!龙蜥邀您共同探索面向泛在智算场景的操作系统技术

OpenAnolis小助手

AI 操作系统 龙蜥社区 龙蜥meetup

NJet Portal 应用门户管理介绍

通明湖

等保备案证明更新

等保测评

秒懂 AI Agent:落地局限与产品解析

Techinsight

智能体 agent 智能体评估

华为仓颉语言初识:并发编程之同步机制(下)

IT小码哥

鸿蒙 HarmonyOS HarmonyOS NEXT

低代码与AI的医药行业适配性实践:从技术融合到数智化转型的深度解析

量贩潮汐·WholesaleTide

低代码

指标体系建设的本质与落地逻辑——从战略到执行的闭环管理

Aloudata

数据分析 指标体系 指标管理 指标平台 指标开发

2025 深度洞察:AI Agent 落地的短板有哪些

Techinsight

立足数字人文,深化历史叙事|科学智能赋能人文社科领域研究

ModelWhale

科学智能 人文社科 山东大学 AI4S

ETL中图表统计分析模版组件使用

谷云科技RestCloud

数据处理 ETL 数据集成 图表统计

京东高薪“抢人”,刘强东杀向携程腹地

趣解商业

京东 携程 酒旅

通义灵码带你玩转 MCP 最佳实践(合辑,持续更新中)

阿里云云效

通义灵码 MCP

龙蜥开发者说:我的龙蜥开源之旅 | 第 32 期

OpenAnolis小助手

龙蜥社区 龙蜥开发者说

11天里13个Apache开源项目宣布退休,Hadoop的时代结束了_大数据_Andrew Brust_InfoQ精选文章