【ArchSummit架构师峰会】精华内容上线75%,AI大模型中台从理念到实践的探索!>>> 了解详情
写点什么

在容器中使用 Java 的资源分配准则

  • 2019-11-19
  • 本文字数:2538 字

    阅读完需:约 8 分钟

在容器中使用Java的资源分配准则

短短几年,容器就改变了软件行业的开发模式。也许,很多开发者已经开始在容器中运行 Java 应用。但是,对于容器化的 Java 应用程序,当遇到 CPU 和内存占用等问题时,还是有很多问题需要注意。本文假设读者对 Java 和容器技术有基本了解,如果需要更多背景知识,可以阅读文末的参考文献。


堆空间

如果说在容器中运行 Java 应用有一条核心定律,那么就是:对于在容器中运行的 Java 进程,不要手工设置 JVM 堆内存。相反的,设置容器的限制。

为什么?

首先,设置容器的限制可以实现容器/cgroup 提供的基本功能,既隔离容器内进程的资源使用。当我们通过 JVM 参数手工设置堆内存的时候,就意味着彻底无视这个功能。这样能够方便的调整容器资源分配,为自动化扩缩容容器(例如 K8s 垂直 pod 自动扩缩容)打开了大门,而无需手工调整 JVM 参数。


如果容器运行在编排引擎环境中(例如 Kubernetes),那么容器的限制对于节点健康度和调度都非常重要。调度器需要使用这些限制来找到适合容器运行的节点,同时确保节点之间负载均衡。如果通过 JVM 参数设置内存使用,这个信息无法通知到调度器,因此调度器无法知道如何为容器分配负载。


如果不设置容器限制,同时运行在容器中的 Java 进程也没有显式设置 JVM 内存参数,那么 JVM 将会自动设置最大堆内存为运行节点总内存的 25%。例如,如果容器运行在一个内存为 64GB 的节点上,JVM 进程堆内存最大可设置成 16GB。如果这个节点上运行了 10 个容器(对于自动扩缩容经常发生),那么可能会突然需要 160G 内存。

我们能做什么?

设置容器内存(和 CPU)限制,依赖资源请求(软限制)是不够的。资源请求对调度器非常有用,但是设置硬限制让 Docker(或者其他容器运行时环境)为容器分配指定资源,同时确保不会超出。这也让 Java(在 Java 8u191 之后,默认提供“容器感知”功能)基于容器设置的资源限制自动分配内存,而不是通过运行节点分配。

关于[Min|Max|Initial]RAMPercentage 参数

最近的Java版本中,引入了如下 JVM 参数(同时向后移植到了 Java 8u191):


  • -XX:MinRAMPercentage

  • -XX:MaxRAMPercentage

  • -XX:InitialRAMPercentage


本文不会详细介绍这些参数如何工作,但是关键点是这些参数可以在不需要直接设置堆内存大小的情况下用于调优 JVM 堆大小。也就是说,容器仍然可以依赖对其设置的资源限制。


那么,这些参数的值该怎么设置呢?答案是:看情况,尤其是依赖于容器上设置的资源限制。


默认设置下,JVM 堆内存会设置成容器内存的 25%。我们可以通过这些参数来修改初始、最小、最大堆内存。例如,设置-XX:MaxRAMPercentage=50 将会允许 JVM 将容器内存的 50%作为堆内存使用,而不是默认的 25%。这样设置是否安全主要取决于容器运行的内存以及容器内的进程情况。


例如,假设容器只运行一个 Java 进程,分配了 4GB 内存,而我们设置了-XX:MaxRAMPercentage=50,此时 JVM 堆内存上限是 2GB。这与默认情况下只能使用 1GB 内存不同。在这种情况下,50%基本上是非常安全的,也许也是最佳的,因为还有许多可用内存实际利用率都不高。相反,假设相同的容器只分配了 512MB 内存,现在设置了-XX:MaxRAMPercentage=50 之后,堆内存会占用 256MB 内存,而对于容器剩下的所有可用内存就只有 256MB 了。这些内存需要被容器中运行的其他进程共享,同时还有 JVM 的 Metaspace/PermGen 等其他内存使用。因此在这种场景下,50%可能不太安全。


这里提供如下建议:


  • 除非想为 Java 进程压榨额外内存,否则不要修改这些参数。在大部分情况下默认值 25%对于内存管理来说是比较安全的。这个设置对内存来说可能并不是最有效的,但是内存是相对廉价的,同时相比于 JVM 进程在未知情况下被 OOM-kill,还是谨慎一些比较好。

  • 如果非要调试这些参数,还是保守点为妙。50%通常是个安全值,可以避免(大部分)问题。当然,这还是主要取决于容器内存大小。我不推荐设置成 75%,除非容器至少有 512MB 内存(最好是 1GB),同时需要对应用程序的实际内存使用非常了解。

  • 如果容器内除了 Java 进程之外还有其他进程,那么在调整这些值的时候需要额外的注意。容器内存由其中所有进程共享,因此在这种情况下,了解整个容器内存使用会更加复杂。

  • 设置成超过 90%可能是在自找麻烦。

对于 Metaspace/PermGen/其他内存呢?

这已经超出了本文的范围,不过这些也可以调整,通常情况下最好不要。大多数情况下,JVM 默认行为已经很好了。如果你发现自己正试图解决一个晦涩的内存问题,那么可能需要研究一下 JVM 内存这个深奥的领域。其他情况,我尽可能避免直接去修改。

对于 CPU

对于 CPU 没有什么可做的。从 Java 8u191 开始,JVM 默认情况下已经实现“感知容器”,能够正确解析 CPU 共享(CPU Share)设置。这里有一些细节需要理解,因此我直接附上一篇不错的文章,详细介绍相关知识,就不在本文中概述。

总结

现代的 Java 已经为容器环境做好了准备,但是为了应用程序能够有更好的性能,其中有一些不是那么明显的细节需要我们了解。我希望本文提供的信息,加上优秀的参考文献,可以帮助读者达到这个目的。


参考文献



附录:


在 64GB/16GB JVM 例子中,这里并不是说 JVM 进程会为堆内存自动消费 16GB 内存,只是说在内存溢出之前,堆内存可以增长到那么大。另外,由于设置的最大堆内存还有很多,对于垃圾回收器来说没有压力,堆内存很容易在触发垃圾回收之前,消耗多余容器实际可以提供的内存。这必然会引起应用程序问题(例如 OOM 错误),甚至更严重的错误(例如被 OOM kill,崩溃)。


原文链接:


https://www.ccampo.me/java/docker/containers/kubernetes/2019/10/31/java-in-a-container.html


2019-11-19 14:106409

评论 2 条评论

发布
用户头像
针对-XX:MaxRAMPercentage设置比例这块,作者太武断了,JAVA应用本来都很吃内存,生产环境一般是1G-2G的内存limit限制,-XX:MaxRAMPercentage设置成 75% 是公认的比较合理的值。
2021-08-31 19:21
回复
用户头像
需要容器化部署
2019-11-27 17:26
回复
没有更多了
发现更多内容

元器件科普 | 无源元件之——电容基础知识(超详细)

元器件秋姐

元器件采购 华秋商城 电容 电容器 电解电容器

阿里云云原生加速器成员企业袋鼠云创始人陈吉平:深耕国产自研数字化技术与服务,持续为客户创造价值

阿里巴巴云原生

阿里云 云原生

万恶的strpos函数

J.Smile

自学php

大规模 Spring Cloud 微服务无损上下线探索与实践

阿里巴巴云原生

阿里云 微服务 云原生 Spring Cloud

云小课|帮您高效快速上传组件至私有依赖库

华为云开发者联盟

云计算 后端 华为云

进场感知,主动服务|诚迈联手华为打造HarmonyOS原子化服务解决方案

最新动态

BANI时代下PMO如何求得生存?

PMO实践

项目管理 PMO 2022

在大数据培训学习中怎么成为优秀的程序员

小谷哥

学历低可以参加大数据培训吗

小谷哥

MemArts :高效解决存算分离架构中数据访问的组件

华为云开发者联盟

云计算 后端 华为云

Stable Diffusion半秒出图;VLIW的前世今生;YOLOv5全面解析教程 | AI系统前沿动态

OneFlow

人工智能 深度学习 VLIW

PMO推行制度落地陷入困境怎么办?

PMO实践

项目管理 PMO 项目经理

【保姆级】github博客快速搭建

Shen-Xmas

GitHub 前端 后端 博客 博客搭建

企业数字化转型中面临的开源供应链的挑战及应对措施

安势信息

开源 企业数字化转型 开源软件供应链 软件供应链安全 安势信息

云原生系列 二【轻松入门容器基础操作】

叶秋学长

云原生 沙箱实验 11月月更

哪些人适合参加前端培训?

小谷哥

前端自学能学会吗,培训怎么学

小谷哥

集世界杯+GameFi元素的MetaElfLand,为何将在世界杯期间爆发?

股市老人

怎么判断自己适不适合做大数据培训

小谷哥

年终最重磅!云原生实时数仓 SelectDB 首次产品发布等你来约!

SelectDB

数据库 云计算 大数据 实时计算

集世界杯+GameFi元素的MetaElfLand,推出世界杯专场活动

小哈区块

集世界杯+GameFi元素的MetaElfLand,推出世界杯专场活动

EOSdreamer111

Serverless Devs 社区联合信通院邀请您参加 2022 中国 Serverless 用户调查

阿里巴巴云原生

阿里云 Serverless 云原生

OneFlow-ONNX v0.6.0正式发布

OneFlow

人工智能 深度学习

一文详解GaussDB(DWS) 的并发管控和内存管控

华为云开发者联盟

大数据 后端 华为云

如何通过 NFTScan 浏览器查询 NFT项目的 Metadata 数据【教程】

NFT Research

区块链 NFT

【论文复现】Panoptic Deeplab(全景分割PyTorch)

华为云开发者联盟

人工智能 华为云 论文复现

如何将项目经理负责制落到实处?完成这3个前置条件!

PMO实践

项目管理 PMO 项目经理

如何写出一份“有结果”的年度工作总结【超极实用!】

PMO实践

项目管理 PMO 项目经理 工作总结

助力双12,Quick Stock-瓴羊交易9.9元畅享打单发货

瓴羊企业智能服务

Amazon Braket 与量子计算

亚马逊云科技 (Amazon Web Services)

量子计算 Hero 专栏 Amazon Braket

在容器中使用Java的资源分配准则_服务革新_Christopher Campo_InfoQ精选文章