写点什么

Apache 拟在 Docker 中运行 Hadoop

  • 2014-09-04
  • 本文字数:840 字

    阅读完需:约 3 分钟

Apache 在其 Hadoop wiki 上整理了 Docker 中运行 Hadoop 的优势,以及要完全在 Docker 中运行 Hadoop 所需要完成的工作。在 Docker,或者说其它容器中运行 Hadoop YARN 有很多优势,具体如下:

  1. 软件依赖和配置的隔离:在 Docker 中运行的应用,其软件依赖和配置是与宿主机完全没有关系的,跟其其它行在 Docker 中的应用也没有关系;
  2. 安全性:运行在 Docker 中的应用,在没有主动配置的情况下,基本没有办法访问(即便是 Docker 镜像中的 root 权限)宿主文件系统的内容,这可以很好的保护宿主文件系统、设备等等;
  3. 性能隔离:Docker 可以对应用所需要的资源,如 CPU 计算资源、内存资源、存储资源、带宽等进行调控;
  4. 一致性:只要是源自同一个 Docker 镜像,所有的任务就具有完全一致的软件环境,跟宿主环境无关。比如一个 Ubuntu 镜像可以像使用真正 Ubuntu 系统一样利用其特性,哪怕宿主机器是 RHEL;
  5. 快速部署:Docker 有着强大的镜像存储和分发能力,开发者可以很方便的从镜像中心获取 Hadoop YARN 应用的镜像;
  6. 可编程:通过 Dockerfile,开发者可以非常方便地对 YARN 应用的文件系统、环境配置和运行的脚本进行设置;

虽然容器的优势是明显的,但是目前 Docker 和 YARN 的情况却无法支撑完全在 Docker 中运行 Hadoop YARN 任务,Apache 提出需要对 Docker 和 YARN 进行修改的想法,并给出了一些目前计划的工作:

  1. YARN 的 Docker 执行器;
  2. Docker 需要支持 user namespaces,以便可以将 Docker 镜像中的 root 用户映射到宿主机的普通用户,来控制用户对宿主文件系统的访问;
  3. 容器的网络配置:这项工作主要为了让 YARN 的主节点同其他节点通信,Docker 现有的 NAT IP 地址不允许运行在某个镜像中的任务访问另外一台物理宿主上运行的其他任务;
  4. 动态配置资源限制:目前 Docker 不支持动态对镜像资源进行配置;

感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-09-04 03:483078
用户头像

发布了 268 篇内容, 共 123.8 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

局域网部署,用WorkPlus视频会议保密又安全

BeeWorks

AI +悦数图数据库:图技术与大语言模型 LLM 结合,打造下一代知识图谱应用

最新动态

扎根x86市场稳步前进-海光投研报告解读

三掌柜

研究报告

appuploader不是开发者账号

雪奈椰子

appuploader不是开发者账号

Rust中的高吞吐量流处理

高端章鱼哥

rust 流处理

技术分享 | 网页 frame 与多窗口处理

霍格沃兹测试开发学社

盘点国产CPU“六君子”之中科海光发展史

石云升

cpu 微处理器 中科海光

使用 RediSearch 在 Redis 中进行全文检索

AlwaysBeta

redis redisearch

准确率提升近4%,自研ASR模型助力公安机关筑牢反诈安全网

中关村科金

技术分享 | Selenium多浏览器处理

霍格沃兹测试开发学社

2023最新版Java八股文汇总(附1100道面试题及答案详解)

采菊东篱下

Java 面试

【腾讯云Cloud Studio实战训练营】如何成为一名合格的Python爬虫“念咒师”(基于ChatGpt)

孤寒者

Python Cloud Studio Python爬虫 念咒师 念咒编程

组织门户支持成员自主公开,快速搭建内容|ModelWhale 版本更新

ModelWhale

云计算 数据分析 API 算力 数据门户

详解 HashMap 的底层实现原理

树上有只程序猿

Java 数据结构 hashmap 哈希

探索大模型应用,解决企业数字化转型“最后一公里”

中关村科金

技术分享 | 黑盒测试方法论-判定表

霍格沃兹测试开发学社

“新一代企业数字化联盟”走进嘉定,数划云与众多企业一起探讨数字化转型

数划云

【7.28-8.4】写作社区优秀技术博文一览

InfoQ写作社区官方

海光财报解读:深耕研发,打造技术护城河

程序员海军

研究报告 海光

技术分享 | web前端的HTML浅析

霍格沃兹测试开发学社

app测试中常用的Android模拟器

霍格沃兹测试开发学社

面部表情识别在安全领域的应用

来自四九城儿

技术分享 | 白盒测试方法论

霍格沃兹测试开发学社

私有化部署企业IM即时通讯:提升效率、防止泄密、高效协同办公

BeeWorks

面部表情识别在教育领域的应用

来自四九城儿

面部表情识别的伦理问题

来自四九城儿

开源社区寻找八月创作之星!你准备好了吗~

Openlab_cosmoplat

人工智能 开源

Apache拟在Docker中运行Hadoop_开源_张天雷_InfoQ精选文章