写点什么

大数据独角兽 Cloudera 股价腰斩,Hadoop 将何去何从

  • 2019-06-08
  • 本文字数:2057 字

    阅读完需:约 7 分钟

大数据独角兽Cloudera股价腰斩,Hadoop将何去何从

美东时间 6 月 6 日美股开盘后,大数据公司 Cloudera 股价暴跌 43%,在此之前该公司刚刚宣布首席执行官 Tom Reilly 将离职,并下调了 2020 年收入预期。在与竞争对手 Hortonworks 合并五个月后,尽管 Cloudera 不断尝试实现持续增长,但现金仍在流失,这引发了人们对其数据分析技术未来发展前景的担忧。在 2014 年由英特尔主导的融资轮中,Cloudera 估值曾高达 41 亿美元,而今其市值已经缩水为 14 亿美元。



一周前,曾经同为大数据独角兽的 MapR 也传出了面临重大危机的消息。根据加州就业发展部门的一份文件,MapR 于 5 月 14 日通知加州就业发展局,计划在其 Santa Clara 总部裁员 122 人。在工人调整及再培训通知 (WARN) 文件中,这次裁减被标记为“永久性关闭”,将于 6 月 14 日生效。这些是否昭示着 Hadoop 这一生态的衰败?


下文授权转载自微信公众号来源 “legendtkl”


Hadoop 包括两部分 MapReduce 和 HDFS,分别对应 Google 三架马车论文中的 MapReduce 和 GFS。后来 Hadoop 的 MapReduce 调度框架为了实现抽象度更高的资源调度,将编程模式剥离出调度框架,就出现了 YARN(Yet Another Resource Negotiator)。所以我们现在常说的 Hadoop 其实就是 HDFS 和 YARN。


围绕 Hadoop 进行商业化有著名的三巨头,分别是 Cloudera、Hortonworks 和 MapR,如今都不约而同地陨落了。

Cloudera

Cloudera 于 2008 年成立,创始人来自 Google、FaceBook 和 Yahoo!,在 2008 年还不知道大数据为何物的时候创办 Cloudera,可谓非常有眼光。还有一点不得不提的是,Cloudera 的首席架构师 Doug Cutting, 也就是 Hadoop 的第一位作者,后来被 Yahoo! 招安,再之后转投 Cloudera。顺风顺水,后来升至 Apache 基金会主席。



Cloudera 的 Hadoop 发行版 CDH 是免费的,但是公司通过卖服务赚钱。比如 Hadoop 集群的管理软件 Cloudera Manager 就是收费的。Cloudera Manager 的功能包括集群的管理、部署、监控、升级等,简单来说就是运维。而这些都是公有云要做的,毕竟云计算就是卖运维。


Cloudera 在 2014 年随着不断融资,投资方包括 Intel、Google,市值到达顶峰 41 亿美元。之所以说是顶峰,是因为之后的三年 Cloudera 的发展并没有如预想中的顺利,也终于在 2017 年以 20 多亿美元匆忙上市。

Hortonworks

Hortonworks 于 2011 年由 Yahoo! 的 Hadoop 团队拆分而成,和 Cloudera 不同的是,Hortonworks 的代码是完全开源的。但是相比 Cloudera 起步晚,而且缺少了 Doug Cutting 这种领袖人物,亮点可谓乏善可陈。公司成立三年就于 2014 年匆忙上市,上市之初市值十多亿美元。



无论是 Cloudera 还是 Hortonworks 都没有赶上云产商这班车,比如著名的开源软件吸血鬼 AWS,针对 Hadoop 生态的公有云产品 Elastic MapReduce 对 Cloudera 和 Hortonworks 两家公司的影响不可谓不小。可能是疲于同行业内耗,最终两家公司与 2018 年 10 月份宣布合并,但是以事后的角度来看,合并并没有什么用。

MapR

MapR 的创始人 M.C.Srivas 来自于 Google。客观来说 GFS 架构设计其实并不是很好,HDFS 相当于对 GFS 论文的一种拙劣的模仿。而 Google 内部使用的分布式文件系统也是多方面碾压 HDFS。所以 M.C.Srivas 创立 MapR 的时候就将 Hadoop 的文件系统 HDFS 进行了重构,同时兼容了 Hadoop 协议,但是是闭源的。MapR 的商业化之路主打系统的性能等优于开源 Hadoop 的特性,在售价上也要高于 Cloudera。MapR 一度给人一种用技术挑战整个 Hadoop 社区的感觉,只不过很多人不买账。



在 MapR 看似一切都还发展不错的时候,M.C.Srivas 在 2016 年离开了 MapR 加入了 Uber。对于一个创业公司来说并不是一个好的信号,直到 2019 年 5 月底爆出消息,MapR 融资困难,可能在不久之后关闭。曾经估值高达 10 亿美元的一代枭雄或将在此陨落。


延伸阅读


大数据“独角兽”折戟:MapR 或将裁员百余人,并关闭硅谷总部

启示

Hadoop 除了这三家发行商,目前在各大云厂商上都还以 Elastic MapReduce 的形态存在,包括 AWS EMR、Aliyun EMR 等。目前来看,对于 Hadoop 的存在形态,还会在公有云上存在一段时间。但是还能存在多久,拭目以待。


Hadoop 商业化平台的衰败或许并不能代表整个大数据行业的衰败,但是却预示着 Hadoop 的失败,对 Hadoop 的后续开发维护必然会产生影响。


作为 Hadoop 的替代产品,HDFS 在 AWS 上早已被 S3 取代。国内的各大公有云产生也有自己自研的文件系统。YARN 或许还能存在一段时间,很早之前就有人推崇使用 Kubernetes 来替代 YARN 作为资源调度器。但是由于 Kubernetes 的调度器是一种集中式的资源调度器,而 YARN 是两层资源调度器,目前 YARN 上面的作业并不能很容易地无缝迁移到 Kubernetes。

结语

Hadoop 本是 Google 的上一代技术三架马车(GFS、MapReduce、BigTable)的模仿,设计不可谓优雅,但是也发展了十年左右,借着大数据的这班车也抢尽了风头。如今 Google 又开源了 Kubernetes 系统,大家才发现进程应该结合 Namespace 和 Cgroup 来跑,然后整个社区又被 Google 带着跑。


有的时候不得不说,号称不做恶的 Google 有的时候还是挺坏的。


2019-06-08 13:5011159

评论 1 条评论

发布
用户头像
看到这个消息有点儿悲剧。话说完全的开源让除了依赖于谷歌这种有收入的公司之外的开源创新很难形成良好的持续性生态,不知道是喜是忧
2019-06-10 09:26
回复
没有更多了
发现更多内容

软件测试/测试开发丨​利用ChatGPT编写测试用例

测试人

软件测试 测试开发 ChatGPT

灞桥康养论坛圆满落幕 灞桥康养“四片区”邀您遇见新西安

联营汇聚

文盘Rust -- tonic-Rust grpc初体验 | 京东云技术团队

京东科技开发者

rust gRPC 虚拟操作系统 企业号9月PK榜

高并发系统设计之缓存

Java随想录

Java nginx 缓存

20个最佳实践提升Terraform工作流程|Part 1

SEAL安全

基础设施 IaC terrafrom 企业号9月PK榜

Hologres RoaringBitmap实践:千亿级画像数据秒级分析

阿里云大数据AI技术

大数据 阿里云

TDengine 与煤矿智能 AI 视频管理系统实现兼容性互认

TDengine

时序数据库 #TDengine 恒达智控

http代理ip服务器有哪些?代理服务器有什么作用?

巨量HTTP

代理IP http代理

微调语言模型前,需要考虑这三个关键方面

Baihai IDP

AI LLM 白海科技 大模型微调 Baihai IDP

Multitrack Editor for Mac(多轨音频编辑软件) v1.0.5完美激活版

mac

苹果mac 音频编辑软件 Windows软件 Multitrack Editor

Bridge 2024 (br2024) for Mac v14.0.0.102 中文破解激活版

mac

windows 苹果mac Bridge 2024

CodeArts Check代码检查服务用户声音反馈集锦(2)

华为云PaaS服务小智

云计算 软件开发 代码规范 华为云 代码检查

交易所开发 通过定制解决方案获得优势:加密货币交易服务

区块链软件开发推广运营

交易所开发 数字藏品开发 dapp开发 区块链开发 链游开发

第五期 PaddlePaddle Hackathon 飞桨黑客马拉松热身赛上线!

飞桨PaddlePaddle

深度学习 编程、

“融合康养产业、乐享宜居灞桥”灞桥康养论坛成功举办

联营汇聚

GaussDB(for Redis)游戏实践:玩家下线行为上报

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号9月PK榜

分布式系统的主键生成方案对比 | 京东云技术团队

京东科技开发者

分布式系统 uuid 企业号9月PK榜 主键生成

【ChatGPT-应用篇】基于chatGPT覆盖测试过程的初步探索 | 京东物流技术团队

京东科技开发者

人工智能 测试 ChatGPT 企业号9月PK榜

DApp智能合约链上盲盒游戏代币质押项目挖矿系统开发

l8l259l3365

Pyth

程序员会使用的十个基础算法

小魏写代码

NFTScan Meetup 上海站主题分享:TON 的发展现状与未来展望

NFT Research

NFT\

DR6018|IPQ6010 IPQ6018 WiFi6 2X2 QSDK OpenWiFi Cloud AP AC Customizable Solution

wallyslilly

IPQ6010 ipq6018

坐标休斯顿,TDengine 受邀参与第九届石油天然气数字化大会

TDengine

时序数据库 #TDengine

本地缓存无冕之王Caffeine Cache

Java随想录

Java 缓存

小灯塔系列-中小企业数字化转型系列研究——进销存测评报告

人称T客

推送服务本地通知频次及分类管控通知

HarmonyOS SDK

HMS Core

万字长文教你实现华为云IoT+OpenHarmony智能家居开发

华为云开发者联盟

鸿蒙 物联网 华为云 华为云开发者联盟 企业号9月PK榜

iOS16新特性:实时活动-在锁屏界面实时更新APP消息 | 京东云技术团队

京东科技开发者

iOS16 企业号9月PK榜 Live Activity

IPQ4019 802.11a/b/g/n/ac-802.11ax IPQ5018 WiFi standards as motherboard chips IIOT application

wifi6-yiyi

IPQ4019 802.11AX

大数据独角兽Cloudera股价腰斩,Hadoop将何去何从_大数据_陶克路_InfoQ精选文章