金融科技复合型人才缺口持续扩大,企业如何实现内部人才“活水”? 了解详情
写点什么

MRS 2.0 性能再度爆破,更加简单易用

  • 2020-03-25
  • 本文字数:4919 字

    阅读完需:约 16 分钟

MRS 2.0 性能再度爆破,更加简单易用

MapReduce 服务上线以来,我们在用户的意见和建议中不断地进行改进和优化。如今 MRS 已来到 2.0 时代。MRS 2.0 对大数据引擎做了全面升级,并推出实时流与批分析一体的混合集群,支持计算存储分离的统一存储方案,为客户提供低成本、高性能、更易用的全新一站式大数据平台服务。


下面就由小编给大家详细介绍下 MapReduce 2.0 的新特性。



MRS 2.0 新特性一览表

一、MRS 2.0 vs 1.x ——Hadoop 篇:

冷数据占存储空间更小


对于冷数据的存储,我们一直希望能够减少其所占存储空间。纠删码作为给 HDFS 拓展的新特性,是一种与副本相比更节省存储空间的数据持久化方法。


传统 HDFS 数据只采用冗余的方式来获得数据可靠性(默认冗余 200%),带来了存储成本的提升。该技术在 HDFS 实现了纠删码使得数据冗余减少到 50%,且可靠性更高(使用 Reed-Solomon(10,4)编码的数据可以允许 4 个节点失效),并引入条带化的块存储结构,最大化的利用现代集群单节点多磁盘的能力,使得数据写入性能在引入编码过程后,仍和原来多副本冗余的性能接近,更值得一提的是,应用层无需改动写入数据的实现方式即可获得这部分提升。


使用场景上,纠删码编码的数据在读写数据时,会耗费更多的 CPU,在 CPU 资源富裕的大数据应用场景,能给客户带来更大的成本空间。


Yarn 的 Opportunistic Containers


过去的 YARN 集群,资源利用率较低,主要有两个因素,一是延迟反馈,YARN 依赖心跳管理集群资源,空闲资源能够再次被申请,需要多次心跳交互才能感知到;二是 YARN 应用声明的资源比实际使用量大,导致利用率低。


Opportunistic Containers 相对于之前的 Guaranteed Container 来说,优先级更低,会被 Guaranteed Container 抢占,但其优势在于让 container 请求在 YARN 的 NodeManager 节点排队(即使资源不足),一旦有空闲资源,可以立即开始执行,消除了延迟反馈,提升了 Container 启动速度,从而提高了集群利用率。


新机制实现 Yarn 的高扩展


新引入 Yarn federation 机制:将一个超大的集群分解成多个子集群的方式来实现 Yarn 的高扩展性,每个子集群有自己的 ResourceManager 和 NodeManager,Yarn federation 将这些子集群拼接在一起使他们成为一个大集群。在 Yarn federation 环境中,Application 看到的是一个超大的集群,并且能够在整个集群的任何节点执行 Task。


支持自定义资源模型


从 MRS 2.0 开始,Yarn 支持自定义资源模型(support user-defined countable resource types),不仅仅支持 CPU 和内存,比如集群管理员可以自定义诸如 GPU,软件许可证等等资源,Yarn 任务可以根据这些资源的可用性进行调度。


除此之外,华为云 MRS 服务 2.0 全面兼容 Hadoop 3 版本,提供了 DataNode 节点内多磁盘均衡工具,来处理添加或替换磁盘时可能导致的 DataNode 内部多块磁盘存储的数据不均衡的问题。

二、MRS 2.0 vs 1.x ——Hive 篇:

新执行引擎 Tez


MRS 2.0 上的 Hive,使用新的执行引擎 Tez 代替原先的 MapReduce,性能有了显著提升。


Tez 可以将多个有依赖的作业转换为一个作业(这样只需写一次 HDFS,且中间节点较少),从而大大提升 DAG 作业的性能。下面的图表阐述了这个过程:



左图表展示的流程包含多个 MR 任务,每个任务都将中间结果存储到 HDFS 上(前一个步骤中的 reducer 为下一个步骤中的 mapper 提供数据)。右图表展示了使用 Tez 时的流程,仅在一个任务中就能完成同样的处理过程,任务之间不需要访问 HDFS。


使用 Tez 完成 Hive 查询的好处包括:


  • 它为你提供了全面的 DAG 支持,同时会自动地在集群上完成大量的工作,因而它能够充分利用集群的并行能力,在多个 MR 任务之间不需要从 HDFS 上读 / 写数据,通过一个单独的 Tez 任务就能完成所有的计算。

  • 它提供了会话和可重用的容器,因此延迟低,能够尽可能地避免重组。

  • 兼容原先 MR 任务。


Tez 提供了的全新的 UI 界面,可以更加方便的查看每个任务的执行情况。



提供了 HPLSQL


MRS 2.0 中的 Hive 支持存储过程(HPLSQL)。使用存储过程能够更加方便的执行具有关联性的 HQL 语句集,通过定义变量和传参,灵活地调用方法获取事务的执行结果,比之前反复执行多条 hql 语句效率更高。通过定义连接,可以在一个 HPLSQL 中访问不同的关系型数据库。


下面是一个简单的 HPLSQL 例子:


CREATE FUNCTION hello(text STRING)RETURNS STRINGBEGIN  RETURN 'Hello, '   || text || '!';END; FOR item IN (  SELECT s1,s2 FROM   test limit 10)LOOP  PRINT item.s1 ||   '|' || item.s2 || '|' || hello(item.s1);END LOOP;CREATE FUNCTION hello(text STRING)RETURNS STRINGBEGIN  RETURN 'Hello, '   || text || '!';END; FOR item IN (  SELECT s1,s2 FROM   test limit 10)LOOP  PRINT item.s1 ||   '|' || item.s2 || '|' || hello(item.s1);END LOOP;
复制代码


HiveWebUI 使运维更加简单


HiveServer 如今提供的 web 界面,可以方便查看正在运行的 SQL 有哪些,执行了多长时间等,可以说是运维同学的一大福音。



新版本的 Hive 还充分利用现代 CPU 提供的 SIMD,AVX2 等指令集,来提高 CPU 利用效率。例外,CBO 这种基于代价的查询优化,对于多表 join 性能优化效果显著。使用新版本后,根据不同场景,Hive 的性能提升了不止 50%呢。

三、MRS 2.0 vs 1.x ——Spark 篇:

真正毫秒级低延迟处理


无论是最早的 Spark Streaming,还是 Spark 2.0 中推出的 Structured Streaming,均采用定时触发,生成微批的方式实现流式处理。


Spark Streaming 的处理逻辑如下:当新的数据到达时,Driver 需要等到定时器下一个触发的时刻,将这段时间内到达的所有新数据生成一个新的批次,并将其加到一个队列中。之后,会由 Driver 的另一个线程获取队列中的批次,解析处理后生成 Task 并分发给各个 Executor 执行。显然,等待定时器触发,以及分发 Task 到 Executor 执行,都带来了额外的时间开销 Structured Streaming 处理逻辑有所不同,但存在相同的问题。


MRS 2.0 中包含的 Spark 2.3 版本,在 Structured Streaming 中新加入了 Continuous Processing 模式,正是解决了上述问题。使用该模式时,会在各个 Executor 上启动一组长时间运行的任务,而不再是定时触发。数据一旦到达,就会立刻被计算处理,从而避免了等待定时器下一次触发的额外时间消耗,以及生成 Task 并分发到 Executor 的额外时间消耗,实现了真正毫秒级的低延迟处理,最小延迟从原先的 100 毫秒左右,降低到现在的 3-5 毫秒左右。


支持流和流的 join 操作


在 MRS 2.0 之前,Structured Streaming 仅支持流和静态数据集之间的 join 操作,MRS 2.0 中包含了 Spark 2.3 版本,加入了期待已久的流和流的 join 操作。流和流的 join 操作,支持内连接和外连接,可用在大量的实时场景中,例如比较常见的点击日志流的 join 操作,现在就可以通过几行代码轻松实现。


Structured Streaming 之前在 Spark 2.0 版本中推出,用来替代原先的 Spark Streaming。Structured Streaming 基于 Spark SQL 引擎,使用户能够使用与批处理一样的 DataSet API 来构建流式应用,并能享受 Spark SQL 引擎带来的性能提升,另外,Structured Streaming 还提供了 exactly-once 的语义支持,因此推荐大家使用 Structured Streaming 替代原有的 Spark Streaming 程序。


PySpark 性能优化


基于 Apache Arrow 和 Pandas 库,实现了 pandas_udf。利用 pandas 对数据进行矢量化的优化,并通过 Arrow 降低 Python 与 Spark 的通信开销。使用 pandas_udf 替代 pyspark 中原来的 udf 对数据进行处理,可以减少 60%-90%的处理时长(受具体操作影响)。


MLLib 优化提升


在 Spark 2.3 中带来了许多 MLLib 方面的提升,例如,支持 Structured Streaming 中使用 MLLib 的模型和 pipeline;支持创建图像数据的 DataFrame;使用 Python 编写自定义机器学习算法的 API 简化等。

四、MRS 2.0 vs 1.x ——HBase 篇:

HBase on OBS: 数据与 MRS 集群解耦


HBase2 支持为 WAL 和 HFile 设置存储在不同类型的文件系统,MRS 2.0 中的 HBase2.1 支持设置 WAL on HDFS 和 HFile on OBS,实现存储和计算分离的目的,并有以下几个优点:


  • 计算存储分离可以根据需要对 RegionServer 进行弹性扩缩容,避免计算和存储绑定造成的资源浪费;

  • 华为云 OBS 的单价低于云盘和直通盘,在大容量存储需求下极大的降低存储成本;

  • OBS 支持跨 AZ 和跨 Region 的数据复制,极大提高数据的可靠性。


此外,相比开源 HBase2,MRS HBase2.1 对 on OBS 场景做了更多的可靠性优化:


  • 创建集群支持 on OBS 的模式,简化操作步骤;

  • 简化 Region Location 计算的算法,不再对数据本地性作要求;

  • 数据恢复过程中的 WAL Split 阶段统一在 HDFS 中完成,恢复时长同 on HDFS。


新的多租户方案


RegionServer Group 作为新的多租户方案,可以将多个 RegionServer 进行分组,组成不同的 RGS。不同的表可以分布在不同的 RGS 中,不同 RGS 中的表不会互相受到影响,以这种从 RegionSever 中物理隔离的方式,从而实现多租户的方案。


优化 region 状态转换


AssignmentManager V2 基于 Procedure V2 实现,能够更快速的分配 Region,维护的 region 状态机存储不再依赖于 ZooKeeper,移除了 region 在 zookeeper 中的状态信息,只在 HMaster 的内存和 Meta 表中维护 region 状态,极大的解决了 region 状态转换过程中引起的问题。


优化 HFile 实现方式


MemStore 中的数据达到一定大小以后,先 Flush 到内存中的一个不可改写的 Segment,内存中的多个 Segments 可以预先合并,达到一定的大小以后,才 Flush 成 HDFS 中的 HFile 文件,这样做能够有效降低 Compaction 所带来的写 IO 放大问题。


此外,HBASE 2.x 更改了数据的读写方式,会直接在二级缓存中进行读写,采用堆外内存 Offheap 替代之前的堆内内存,减少对 Heap 内存的使用,有效减少 GC 压力。HBase2.x 开始默认使用 NettyRpcServer 替代 HBase 原生的 RPC server,大大提升了 HBaseRPC 的吞吐能力,降低了延迟。

五、MRS 2.0 vs 1.x ——Kafka 篇:

支持 Kafka MirrorMaker


MirrorMaker 用于 Kafka 集群之间的流数据同步,可以把 Kafka 集群中的消息复制到另一个 Kafka 集群中,这在测试环境引流的时候,或者需要把多个不同的 Kafka 集群的消息合并在一个大集群时非常有用。Kafka mirrormaker 通过 Kafka 集群间的数据镜像能力,实现跨 kafka 集群的消息实时同步备份,可用作在线 kafka 集群的数据容灾场景和 kafka 集群的数据在线迁移场景,提高数据迁移的吞吐量和容错性。

六、MRS 2.0 vs 1.x ——集群管理篇:

混合集群


原先 MRS 只支持独立的分析集群和流式集群,对于一些小型数据场景及测试场景,既要部署分析和流式组件,就需要部署两套集群。


于是 MRS 2.0 引入了“混合集群”概念,在同一集群中用户就可以同时部署分析和流式组件,节省了管理节点的成本,并且可以大大减少不同集群的通信成本,是小型集群和测试场景大大的福音。


混合计费模式的弹性伸缩


企业生产环境长期使用大数据集群,为节省成本往往会选择价格更优惠的包周期预付费购买模式。但大数据的计算资源率随着业务时段存在峰谷变化,如果包年包月购买的资源按照峰值就会存在大量时间段的浪费,按照谷值购买又会存在忙时资源不足影响业务。因此 MRS 2.0 提供了混合计费的弹性伸缩能力,可以在包周期集群上配置弹性策略(按时间段或者业务指标进行集群节点弹性伸缩),弹性部分节点按需收费。客户可以根据业务情况配置自动弹性伸缩策略,MRS 服务会在繁忙时申请额外资源,空闲时释放多余资源,帮助客户降低成本,聚焦核心业务。


Manager 的监控展示的优化


MRS 2.0 的 Manager 界面默认显示历史监控数据,用户可以选择实时或者任意区间查看监控数据查看监控数据更便捷。



磁盘使用率、内存使用率等指标细化显示,主机监控更细致,星型符号标注主备管理节点,用户体验更友好。



MRS 2.0 新增了这么多特性,进一步实现了完整统一的计算系统,为大家提供 7*24 小时不间断服务的系统级平台。同时具有强大的包容的生态圈,并支持计算存储分离的功能,大家从各个平台迁移过来都非常方便。开源中的所有新特性,都可以来 MRS 2.0 上抢先一步体验到。


本文转载自 华为云产品与解决方案 公众号。


原文链接:https://mp.weixin.qq.com/s/gEeVAo7-Af31eRouvpltZA


2020-03-25 16:32848

评论

发布
暂无评论
发现更多内容

稳定可靠安全无忧,华为云发布代码托管服务CodeArts Repo

科技怪授

零基础自学黑客/渗透/网络安全必备知识(详细版),啃完这些足够了

网络安全学海

黑客 网络安全 安全 信息安全 渗透测试

牛掰!“基础-中级-高级”Java程序员面试集结,看完献出我的膝盖

做梦都在改BUG

Java java面试 Java八股文 Java面试题 Java面试八股文

混合多云第二课——混合技术如何每年为京东节省上亿元成本?

京东科技开发者

云原生 混合云 混合多云

运维训练营第18周作业

好吃不贵

GameFi游戏NFT链游开发系统搭建技术

薇電13242772558

NFT

《2023产业互联网安全十大趋势》发布,研判产业安全新趋势

Geek_2d6073

全球使用率最高的五款3DMax插件,总有一款适合你

Finovy Cloud

软件 3ds Max

告别“公厕”脏乱差,光明源智慧公厕推进城市智慧化建设

光明源智慧厕所

智慧城市

2022年总结之 禅道团队扩张篇

禅道项目管理

成年人自学黑客,远比你想的更难......

喀拉峻

程序员 黑客 网络安全 计算机 渗透测试

证书过期为何频频发生,该如何避免?

不思jo

故障 #运维

低代码开发,一场深度的IT效率革命

引迈信息

前端 软件开发 低代码 JNPF

2022年总结之 禅道团队成长篇

禅道项目管理

视频转换工具:MacX Video Converter Pro中文版

真大的脸盆

Mac Mac 软件 视频转换 格式转换器

KubeVela 为 CNCF 孵化器带来软件交付控制平面能力

阿里巴巴中间件

阿里云 开源 云原生 KubeVela

提升数据中心竞争力、公信力-CQC数据中心运维认证

中国IDC圈

认证 #运维

如何手写一个SpringBoot starter组件

做梦都在改BUG

HashData携手新炬网络 共推国产云数仓产业发展

酷克数据HashData

软件测试类型有哪些?它们之间的区别和联系

测吧(北京)科技有限公司

测试

CSIG企业行-走进合合信息成功举行,聚焦生成式人工智能、智能文档处理前沿热点

合合技术团队

人工智能 图像识别 ChatGPT 文档处理 生成式人工智能

阿里云EMAS:2月产品动态

移动研发平台EMAS

阿里云 移动开发 移动研发平台 emas

软件测试/测试开发丨app自动化测试之Appium 原理 与 JsonWP 协议分析

测试人

软件测试 自动化测试 测试开发 appium

架构训练营模块八作业

gigifrog

架构训练营

上海·得物技术沙龙「安全专场」开启报名啦!快来查收你的技术安全白皮书

得物技术

活动

Java开发一年不到,来面试居然敢开口要20K,面完连8K都不想给~

程序知音

Java 编程语言 java面试 java架构 八股文

揭秘ChatGPT背后天价超算!上万颗英伟达A100,烧光微软数亿美元

Openlab_cosmoplat

微软 开源社区 ChatGPT

软件测试/测试开发丨app自动化测试之Appium问题分析及定位

测试人

软件测试 自动化测试 测试开发 appium

Kruise Rollout v0.3.0:教你玩转 Deployment 分批发布和流量灰度

阿里巴巴中间件

阿里云 云原生 OpenKruise

平庸的恐惧,就业的烦恼——致互联网人进退两难的35岁!

禅道项目管理

腾讯T4整合Spring+Spring MVC+MyBatis+Redis实现,附源码

做梦都在改BUG

Java redis 面试 SSM框架

MRS 2.0 性能再度爆破,更加简单易用_行业深度_华为云产品与解决方案_InfoQ精选文章