写点什么

一个 Hadoop 老兵的自白

  • 2015-11-26
  • 本文字数:1078 字

    阅读完需:约 4 分钟

Apache Hadoop 是一个免费软件,但实际上,除非是拥有庞大工程师团队的大公司,否则最好不要去创建仅供内部使用的 Hadoop 版本,因为如果要购买技术支持,那 Hadoop 就不是免费的了。 Jim Scott MapR 企业战略 & 架构部门的负责人。2009 年,他接触了自己的第一个 Hadoop 版本 Cloudera 。他发现,Apache Hadoop 平台存在一些固有的设计缺陷。近日,他从以下几个方面分析了这些缺陷,并介绍了 MapR 的解决方案

Append-only 文件访问方式

HDFS 的 Append-only 文件访问方式是一个巨大的障碍,导致下游项目不得不解决这个问题。例如, HBase 就实现了“墓碑化(Tombstoning)”和“合并(Compactions)”功能。但是,如果这些动作发生在负载高峰期,会严重影响生产系统的性能。MapR 通过创建 MapR-DB 解决了该问题。MapR-DB 模仿了谷歌的 BigTable ,支持 HBase API,是一个零管理实时数据库。

系统集成

HDFS 不兼容 POSIX NFS 。要查看 HDFS 中的文件,只能通过 HDFS 命令行接口来查询。 MapR-FS 是一个操作系统级的文件系统,兼容 POSIX。查看该分布式文件系统中的文件,只需要使用 LS 命令。编辑其中的文件,也不需要专门的工具。Linux 中任何可以读写 NFS 系统的应用程序都可以读写 MapR-FS。

备份 & 恢复

Apache Hadoop 在灾难恢复和备份方面存在严重不足。Hadoop 的数据复制可以有效应对磁盘故障,但对数据损坏和人为错误无能为力。谨慎起见,在向生产环境部署新软件之前,需要生成一个数据快照。但是,Apache Hadoop 的快照只是一个元数据副本。而 MapR 快照则近乎是数据的瞬时拷贝,即使文件正在被写入也可以生成。并且,用户还可以生成 MapR-DB 表的快照。

维护 & 升级

任何优秀的企业应用程序都离不开维护、管理和升级,Hadoop 也不例外。但 Hadoop 的升级维护可能会非常麻烦。MapR 每次发布都会针对许多开源软件项目的多个版本进行测试。它是唯一一个支持在同一个集群上运行软件的不同版本的 Hadoop 版本。

开源软件选择

在使用 Hadoop 的时候,相关开源软件的选择是个难题。MapR 支持开放式 API,提供了一个无偏见的 Hadoop 开源软件集合,使用户能够选择自己需要的开源项目

此外,Jim 还提到,NameNode 是个单点故障点。感兴趣的读者可以进一步阅读

对 MapR 感兴趣的读者,可以下载 MapR M3 社区版本,免费体验 MapR 的


感谢魏星对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-11-26 18:007550
用户头像

发布了 1008 篇内容, 共 431.0 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

Text2SQL准确率暴涨22.6%!3大维度全拆

京东科技开发者

星空开源MES(万界星空科技)——专业、通用、开源、免费的MES系统

万界星空科技

开源软件 mes 开源mes mes源码 万界星空科技mes

AI对齐审计代理技术解析

qife122

AI对齐 模型测试

【灯塔计划】 浏览器崩溃的第一性原理:内存管理的艺术

京东科技开发者

观测云产品更新 | RUM、APM、场景、监控、管理等

观测云

产品迭代

Sentieon 项目文章 | 一例中国男童及139例Pearson综合征患者的临床和遗传特征

INSVAST

基因数据分析 生信分析 Sentieon 精准医疗 线粒体DNA

等保测评流程全解析:步步为营筑安全

等保测评

等保 2.0:开启网络安全防护新篇章

等保测评

浪浪山小妖怪逆袭记:低代码打造基层数字化转型超能力

中烟创新

Cookie、Session、Token、JWT 是什么?万字图解带你一次搞懂!看完这篇,你连老奶奶都能教

左诗右码

从VMware到国产超融合:解析企业虚拟化转型的必经之路

智驱前线

vmware 国产超融合

DAPP的外包开发流程

北京木奇移动技术有限公司

dapp开发 区块链开发 软件外包公司

MCP神器!MCP-USE 一键部署连接任何MCP服务器

程序员海军

AI+ AIGC MCP MCP Server

活动报名:出海增长,从 0 到 1,从 1 到 100、1000 一次性完整分享!丨RTE Meetup

声网

.NET AI强势崛起

秃头小帅oi

海外舆情监测如何成为品牌建设的“导航仪”

沃观Wovision

企业出海 海外舆情监控 沃观Wovision

区块链U卡APP的外包开发

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发公司

VMware 用户如何应对订阅制涨价?超融合能否成为最优替代方案?

智驱前线

突围能源管理难题:MyEMS 开源方案的实战智慧

开源能源管理系统

开源 开源能源管理系统

CST如何在仿真之后添加场监视器继续计算

思茂信息

cst电磁仿真 CST软件 CST Studio Suite

万力轮胎36亿柬埔寨橡胶轮胎项目的RFID技术真相

斯科信息

斯科信息 RFID技术 RFID标签

虚引用GC耗时分析优化(由 1.2 降低至 0.1 秒)

京东科技开发者

Nexa SDK 支持本地运行 Kokoro 等语音模型;AI 猎头智能体 Standout:给 AI 打电话找工作丨日报

声网

持续领跑,再获殊荣!

天翼云开发者社区

云计算 政务云 天翼云

InQL Scanner:GraphQL安全测试利器

qife122

graphql Burp Suite

MyEMS:用开源智能破解能源管理难题,从车间到园区的全场景实践

开源能源管理系统

开源 能源管理系统

利用BERT模型提升语音识别重排序效果

qife122

深度学习 语音识别

MyEMS:开源驱动,重塑智能能源管理新范式

开源能源管理系统

开源 能源管理系统

解码芯安全,天翼云红盾实验室筑牢“芯”防线!

天翼云开发者社区

安全 天翼云

从海外热帖到政策风向:境外舆情如何指导出海战略?

沃观Wovision

海外舆情监控 沃观Wovision 舆情监测系统

“文件自由”的鸿蒙实践:两个独立开发者与《流舟文件》的破局之旅

最新动态

一个Hadoop老兵的自白_语言 & 开发_谢丽_InfoQ精选文章