写点什么

报告显示,Kubernetes 集群通常只使用 13% 的 CPU

THE STACK

  • 2024-03-27
    北京
  • 本文字数:1157 字

    阅读完需:约 4 分钟

大小:586.24K时长:03:20
报告显示,Kubernetes集群通常只使用13%的CPU

摘要:

过度配置 CPU 和内存可以保持正常运行,但代价高昂。资源不足可能会导致 CPU 限制和内存不足,从而导致应用程序性能不佳甚至崩溃。根据 CAST AI 对 4000 个 Kubernetes 集群的分析,Kubernetes 集群通常只使用 13%的 CPU 和平均 20%的内存,这表明存在严重的过度配置。



根据CAST AI对 4000 个 Kubernetes 集群的分析,Kubernetes 集群通常只使用 13%的 CPU 和平均 20%的内存,这表明存在严重的过度配置。

 

在分析了 2023 年 1 月至 12 月期间在 AWS、Azure 和 GCP 管理的 Kubernetes 服务上运行的客户后,该公司在今天的一份报告中指出,优化可以为首席信息官们(CIO)节省一大笔钱。

 

(Gartner 预测,2024 年公有云服务的支出将达到 6780 亿美元,而 FinOps 的议程将继续上升,因此避免在云服务上超支是许多首席信息官(CIO)和首席技术官(CTO)的首要任务。通过 Kubernetes 优化可以节省大量成本。例如,人工智能公司 Anthropic 去年使用Karpenter将其 AWS 账单削减了 40%。)

 

另见:人工智能公司Anthropic通过使用Karpenter将其AWS账单削减了40%

 

对 CAST AI 联合创始人兼首席人才官(CPO)Laurent Gil 来说,调查结果表明,公司仍在“努力应对手动管理云原生基础设施的复杂性”——该公司的报告指出,在 Kubernetes 上,工作负载的大小是根据为 CPU 和内存设置的请求和限制来确定的:“优化它们就像走钢丝。”

 

“过度配置 CPU 和内存可以保持正常运行,但成本很高。”

 

“资源调配不足可能会导致 CPU 限制和内存不足,从而导致应用程序性能不佳甚至崩溃。当团队不完全了解其容器资源需求时,他们通常会谨慎行事,调配比所需更多的 CPU 和内存。”

 

“这就是自动化调整工作负载的用武之地。”他说到。(提供 Kubernetes 成本优化平台的 CAST AI 声称,开源替代方案为本已经很复杂的编排层增加了更多的配置复杂性,而其商业替代方案的即插即用功能是更简单的削减云支出的替代方案。)

 

另见:PlayStation希望让游戏服务器在Kubernetes上运行。原因如下。

 

该报告的调查结果是基于 CAST AI 对 2023 年 1 月 1 日至 12 月 31 日期间在亚马逊网络服务(AWS)、谷歌云平台(GCP)和微软 Azure(Azure)上运行的 4000 个集群的分析,之后这些集群由该公司的自动化平台进行优化。

 

它进一步指出,对于包含 1000 到 30000 个 CPU 的大型集群,组织平均仅使用 17%的预配 CPU。

 

简而言之,报告总结道,造成浪费的最大因素是:

 

  • 过度配置:分配给应用程序或系统的计算资源超过了其所需的数量。

  • 豪无根据的余量:对 CPU 数量的请求设置得太高。

  • Spot 实例使用率低:由于担心不稳定,许多公司不愿意使用 Spot 实例。

  • GKE 上“自定义实例大小”的使用率较低:除非自定义实例的选择是动态且自动化的,否则很难选择最佳的 CPU 和内存比率。

 

完整的报告在这里

 

原文链接:

https://www.thestack.technology/kubernetes-clusters-are-typically-using-just-13-of-cpu-cios-could-save-a-fortune/

2024-03-27 18:034081

评论 1 条评论

发布
用户头像
我觉得TitanIDE在集群管理方面是做的最好的
2024-03-28 16:06 · 广东
回复
没有更多了
发现更多内容

GoFrame v2.5 版本发布,企业级 Golang 开发框架

王中阳Go

Golang GoFrame 新特性

悦数图数据库v3.5.0发布:查询性能大幅提升,为智能决策和 AI 大模型应用提速

悦数图数据库

AI 图数据库 大模型

C++采用Daemon进行后台程序部署

芯动大师

如何使用 Amazon Systems Manager 集中管理 Amazon IoT Greengrass 设备

亚马逊云科技 (Amazon Web Services)

Amazon

云原生网关如何实现安全防护能力

阿里巴巴云原生

阿里云 云原生 网关

C语言实现解一元二次方程

codists

参加SAFe大规模敏捷企业级培训

顿顿顿

safe 大规模敏捷

一张表实现短视频"评论区"完整功能

北桥苏

Nautilus Chain NautDID NFT 将上主网,Layer3 数字身份时代开启

鳄鱼视界

2023-07-17:给定一个数组arr,长度为n, 再给定一个数字k,表示一定要将arr划分成k个集合, 每个数字只能进一个集合。 返回每个集合内部的平均值都累加起来最小的值。 平均值向下取整。 1

福大大架构师每日一题

福大大架构师每日一题

AlienSwap 首期 Launchpad — 偶像女团 NFT+RWA 的创新探索

股市老人

人工智能LLM模型:奖励模型的训练、PPO 强化学习的训练、RLHF | 社区征文

汀丶人工智能

人工智能 强化学习 RLHF ppo算法 年中技术盘点

简易注册中心监控NAS断电断网

WizInfo

Python

直播解锁 Serverless 新进展,与 AIGC 结合有什么搞头?

阿里巴巴云原生

阿里云 Serverless 云原生 AIGC

抓住风向“猪”持续飞,还是维持在风向的高度上?

Bonaparte

产品 产品经理 产品需求 产品培训

实测结果公开:用户见证 StarRocks 存算分离优异性能!

StarRocks

数据库 大数据 数据仓库 OLAP 湖仓一体

大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍| 社区征文

汀丶人工智能

神经网络 Transformer NLP 大模型 BERT 年中技术盘点

代码随想录Day20 - 二叉树(六)

jjn0703

华为云CodeArts Check代码检查新手操作指南

云计算 代码规范 华为云 代码检查

使用 JavaScript 脚本来进行复杂的查询改写

极限实验室

Java JavaScript

来DTT直播间,带你了解openGemini差异化竞争力

华为云开源

开源 时序数据库

香港成新加密中心,JPEX生态平台通证JPC获益颇多

股市老人

再获肯定!柏睿数据通过国家级专精特新“小巨人”企业复核

新消费日报

报告显示,Kubernetes集群通常只使用13%的CPU_云原生_InfoQ精选文章