小舰 - InfoQ

GTLC全球技术领导力峰会·上海站，首批讲师正式上线！了解详情 



 写点什么

小舰

2020 年 11 月 12 日加入

还未添加个人签名

中国人民大学硕士

 关注

25
发布数
2
关注者
0
关注了

全部分类 

Spark 内存管理与调优

小舰

14 小时前

Spark 是基于内存的大数据计算引擎，因此，在编写 Spark 程序或者提交 Spark 任务的时候，要特别注意内存方面的优化和调优。Spark 官方也提供了很多配置参数用来进行内存或 CPU 的资源使用，但是为什么我们要进行这些参数的配置，这些参数是怎么影响到任务执行的，本

多源数据即席查询 Trino(Presto) 引擎剖析

小舰

4 月 20 日

一、起源

Spark 任务等待与运行策略

小舰

4 月 19 日

前面我们提到了 Spark 的资源分配策略，资源配置有静态和动态两种模式，不同模式在任务提交后会有不同的内存占用行为，但是由于队列资源是有限的，因此会出现任务因为资源不够导致等待的情况。本节来详细分析一下任务提交后在的等待与运行影响因素。

带你厘清事务一致性（下篇）

小舰

4 月 18 日

在上篇和中篇中，无论是单机事务的一致性，还是分布式事务的一致性，可以发现都是针对数据库的事务而言的，说到了分布式、一致性话题，我们再继续讨论一个概念 -- 分布式系统的一致性。分布式系统的一致性是一个更加多元和复杂的场景，单纯的 2PC 或者 3PC 协议无法

Spark 运行状态监控与优化

小舰

4 月 17 日

当我们调试 spark 程序或者排查任务运行状态的时候，除了看 spark 提供的原生日志以外，spark 还为我们提供了很好的监控工具 Monitor，具体的参数详情可以参考 Monitoring and Instrumentation。我们本章通过讲解一个 spark 进行资源优化和并发调整的例子来演示如何用