Apache Hadoop 3.3.0发布,正式支持腾讯云对象存储COS

2020 年 8 月 05 日

Apache Hadoop 3.3.0发布,正式支持腾讯云对象存储COS

近日,Apache Hadoop 3.3.0版本正式发布,增加对腾讯云对象存储COS的支持。


Apache Hadoop 3.3.0 是 2020 年 Apache Hadoop 3.3 系列的第一个版本,包含许多重要特性和增强功能,部分列举如下:


  • ARM支持:这是第一个支持ARM体系结构的版本。

  • protobuf升级:由于protobuf-2.5.0版本寿命终止,将protobuf升级到3.7.1。

  • S3A功能增强:对S3A代码做了许多功能上的增强,包括支持委托令牌(Delegation Token)、更好地处理404缓存、改进S3guard性能和弹性。

  • ABFS功能增强:解决实际使用中出现的问题并调整需要优化的地方,适当增加更多测试,改进文档,尤其是故障排除的文档。

  • 实现腾讯云COS文件系统支持:腾讯云是中国市场上排名第二的云供应商,其对象存储COS在中国云用户中得到了广泛使用。COSN文件系统可在Hadoop中原生支持腾讯云COS。

  • Java11运行时支持: Java 11运行时支持的开发工作已完成。

  • HDFS RBF稳定性改进:HDFS路由器现在已提供对安全性的支持,还包含许多错误修复和改进。

  • DNS解析以支持域名到IP服务: DFS客户端可以使用单个域名来发现服务器(名称节点/路由器/观察者),而不必在配置中明确列出所有主机。

  • 机会容器(opportunistic containers)的调度:支持通过中央RM(YARN-5220)、分布式调度(YARN-2877)以及基于实际节点利用率的容器调度(YARN-1011)和容器升级/降级(YARN-5085)来调度机会容器。

  • YARN应用程序的应用程序目录:应用程序目录系统为YARN应用程序提供编辑和搜索界面。这提高了YARN在管理应用程序生命周期的可用性。



Hadoop 是目前应用最为广泛的分布式大数据处理框架,也是大数据处理领域事实上的标准。


大数据分析需要花费大量的计算和存储资源。在传统模式下,计算与存储资源耦合度较高,一旦资源不够,就需要对二者同时进行扩容。近年来,在云计算的推动下,开发者逐渐开始采用云上对象存储,来实现计算与存储的分离,进而提升资源的灵活性,并降低成本。


此次 Hadoop 新版本正式支持腾讯云对象存储 COS,意味着后续开发者在基于 Hadoop 架构进行大数据分析时,能够在不修改代码的情况下,无缝高效地使用腾讯云 COS 来处理海量数据读写任务。这在一定程度上标志着腾讯云对象存储技术受到了 Hadoop 开源社区的认可。


腾讯云对象存储 COS 底层采用腾讯自研存储引擎 YottaStore,能够实现单集群理论管理百万级节点和按需扩容,磁盘利用率达到 90% 以上。


“开发者在腾讯云上可以使用弹性 MapReduce(EMR)计算,并直接使用腾讯云对象存储 COS 作为后端存储,整个过程都不需要额外添加代码,更加方便和快捷。”腾讯云对象存储负责人介绍。


目前,小红书、猎豹移动、珍爱网等公司都使用腾讯云“EMR on COS”的计算与存储分离模式来快速构建和部署大数据分析程序,以满足企业大数据业务需求。


2020 年 8 月 05 日 22:242077
用户头像
蔡芳芳 InfoQ高级编辑

发布了 502 篇内容, 共 228.0 次阅读, 收获喜欢 1365 次。

关注

评论

发布
暂无评论
发现更多内容

再看传记:试图进入和理解他人的生活

Nydia

那片粉紫色的海

空山

旅行

做好微服务架构,并非易事!!

架构师修行之路

微服务

十一长假我肝了这本超硬核PDF,现决定开源!!

冰河

项目管理 jenkins 互联网工程 持续发布

Aspose.pdf破解全程记录

janux

为什么有了SOA,我们还用微服务?

架构师修行之路

微服务

MySQL-技术专题-MySQL的索引

李浩宇/Alex

终于我用JOL打破了你对java对象的所有想象

程序那些事

JOL java对象分析 对象空间占用 java对象

spring-boot-route(十四)整合Kafka

Java旅途

Java kafka Spring Boot

读10x程序员有感。

AdonisPeng

程序员 10X工作法

四面阿里成功定级P6,想和Java程序员谈一谈

Java架构之路

Java 程序员 面试 编程语言

Spring 学习笔记(二)Spring中的一些概念

无语

Spring Framework

涂鸦红外物联网设备开箱使用

良知犹存

物联网 测评

水滴石穿之Java学习之路

孟旬

Java 学习 后端

一个草根的日常杂碎(10月7日)

刘新吾

随笔杂谈 生活记录 社会百态

架构师训练营 1 期第 4 周:系统架构 - 总结

piercebn

极客大学架构师训练营

典型的大型互联网系统使用了哪些技术方案和手段,主要解决什么问题?

极客海

字节跳动总结的这份《Java设计模式(实战+源码)》PDF突然火了,完整版免费开放下载!

Java架构之路

Java 程序员 字节跳动 编程语言 设计模式

一个草根的日常杂碎(10月8日)

刘新吾

随笔杂谈 生活记录 社会百态

我的openEuler社区参与之旅

openEuler

Linux 开源 操作系统 openEuler

高难度对话读书笔记——聆听篇2

wo是一棵草

数字货币交易所系统开发源码,区块链软件搭建

WX13823153201

MySQL-技术专题-存储引擎详解

李浩宇/Alex

汇编入门第一篇,小白也能看懂

cxuan

后端 计算机 汇编

并发和Read-copy update(RCU)

程序那些事

并发 并发和RCU RCU

甲方日常 28

句子

工作 随笔杂谈 日常

Java 中的Exception 有什么用?

Braisdom

Java Exception

TensorFlow 篇 | TensorFlow 2.x 模型 Serving 服务

Alex

tensorflow keras tensorflow serving model serving

两年Java开发经验四面阿里成功拿下P6offer,总结大厂面试的心酸血泪史

Java架构之路

Java 程序员 面试 算法 编程语言

CPU 执行程序的秘密,藏在了这 15 张图里

Java架构师迁哥

一个草根的日常杂碎(10月6日)

刘新吾

随笔杂谈 生活记录 社会百态

Apache Hadoop 3.3.0发布,正式支持腾讯云对象存储COS-InfoQ