写点什么

与 Prometheus 搭配使用 Amazon EKS 控制平面指标

  • 2019-10-04
  • 本文字数:2134 字

    阅读完需:约 7 分钟

与 Prometheus 搭配使用 Amazon EKS 控制平面指标

您可以利用 Kubernetes 核心组件中提供的一系列丰富指标来观察控制平面中正在发生的情况。您可以了解的信息包括:API 服务器的每个资源中 watchers 的数量、审核跟踪事件的数量、向 API 服务器所发送请求的延迟,以及更多信息。这些指标来自于 Kubernetes API 服务器、Kubelet、Cloud Controller Manager 和 Scheduler。这些组件会在 /metrics 处显示内容类型为 text/plain 的“指标”终端节点(通过 HTTP 响应)。这篇博文将详细向您介绍如何基于 Amazon Elastic Container Service for Kubernetes (EKS) 集群获取 API 服务器指标。

先决条件

首先,您必须设置一个 Amazon EKS 集群。在此博文中,我们将在集群配置文件机制中使用 eksctl。首先,必须下载以下工具:


  • eksctl

  • kubectl

  • helm

  • 安装所有必需的工具后,即可开始启动 EKS 集群。在本例中,我们会将集群部署在 us-east-2(即 AWS 俄亥俄区域)中,您可将 AWS_REGION 替换为支持 Amazon EKS 的任何区域。

部署集群

export AWS_REGION=us-east-2
复制代码


在导出区域后,按照如下所示创建 ClusterConfig:


cat >cluster.yaml <<EOFapiVersion: eksctl.io/v1alpha4kind: ClusterConfigmetadata:  name: control-plane-metrics  region: us-east-2
nodeGroups: - name: ng-1 desiredCapacity: 2EOF
复制代码


在创建该文件后,使用 eksctl create cluster 命令创建集群:


eksctl create cluster -f cluster.yaml
复制代码


完成此操作大约需要 10 – 15 分钟时间,之后,便可获得可供使用的 Amazon EKS 集群。

原始指标

在直观呈现指标、监视指标以及接收与指标相关的提醒之前,您可以先看一看这些指标终端节点的输出是怎样的。


kubectl get --raw /metrics
复制代码



这些指标的输出采用 Prometheus 格式。Prometheus 是云原生计算基金会 (CNCF) 的一个成熟项目。它可以扫描与抓取您的集群内的指标终端节点,甚至还能扫描其自身的终端节点。Prometheus 指标的语法为:


metric_name {[ "tag" = "value" ]*} value
复制代码


您可以设置 metric_name、为指标定义 tags(可用于查询),以及设置 value。以下是使用 apiserver_request_count 的一个指标示例:


apiserver_request_count{client="kube-apiserver/v1.11.8 (linux/amd64) kubernetes/7c34c0d",code="200",contentType="application/vnd.kubernetes.protobuf",resource="pods",scope="cluster",subresource="",verb="LIST"} 7
复制代码


这行代码的意思是,我们有 7 个发送给 pods 资源的 LIST 请求。


接下来,我们要使用 helm 设置 Prometheus。

配置 Helm

创建集群后,您可以在本地设置 helm,以免在集群中运行 tiller。按照博文 Using Helm with Amazon EKS 中的步骤操作。


在完成这些步骤之后,您便可以部署 Prometheus。

部署 Prometheus

首先,创建一个 Kubernetes 命名空间,并使用 helm 来部署 stable/prometheus 软件包:


kubectl create namespace prometheushelm install stable/prometheus \              --name prometheus \             --namespace prometheus \             --set alertmanager.persistentVolume.storageClass="gp2",server.persistentVolume.storageClass="gp2",server.service.type=LoadBalancer
复制代码


安装完毕后,您可以把服务列出来,以获取负载均衡器的地址:


kubectl get svc -o wide —namespace prometheus
复制代码



您可以在浏览器中输入此负载均衡器的地址来导航到此负载均衡器,系统会加载 Prometheus UI。您可以在这个地方前往状态 → 目标 – 此页面会向您显示控制平面节点:



如果能够看到自己的节点,您就可以继续检查某些指标。导航到图表,在下拉列表 – 插入光标处的指标 – 中选择任意以 apiserver_ 开头的指标并单击执行。系统随即会从 API 服务器加载最新同步的数据。



您现在可以在控制台视图中查看指标,并且可以切换到图表并直观呈现此数据:


清除

如果您专为运行此测试部署了一个集群,并且希望在测试完后清除此集群的话,您可以先删除 prometheus 命名空间,然后删除集群:


kubectl delete namespace prometheuseksctl delete cluster -f cluster.yaml
复制代码


您可以利用 Prometheus 查看 Kubernetes API 服务器中正在发生的情况,并且能够以图表形式呈现这些指标在一段时间内的变化。您还可以使用 Prometheus 来设置提醒规则(这会填充提醒选项卡)。另外,您可以利用此 helm 图表来部署 Alertmanager,从而根据自己定义的提醒规则来配置提醒。尝试一下修改 prometheus-server configmap 来自己设置一些规则:


kubectl get configmap -n prometheus prometheus-server -o yaml
复制代码


如果您想了解如何像在 Kubernetes API 中这样,在自己的应用程序中使用指标,请查看 Nicholas Turner 和 Nic Cope 的演讲北美 2018 KubeCon CloudNativeCon – 监控全世界:适用于容器化应用程序和集群的有意义指标


作者介绍:


Chris Hein


Chris Hein 是一位资深的开发者,倡导 Amazon Web Services 的 Kubernetes/EKS。加入 Amazon 之前,Chris 曾就职于众多规模不等的公司,如 GoPro、Sproutling 和 Mattel。有关 Chris 的更多信息,请访问 https://aws.amazon.com/blogs/opensource/author/heichris/,并通过 @christopherhein 关注他


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/amazon-eks-control-plane-metrics-prometheus/


2019-10-04 20:341331
用户头像

发布了 1926 篇内容, 共 154.1 次阅读, 收获喜欢 81 次。

关注

评论

发布
暂无评论
发现更多内容

【获奖案例巡展】信创先锋之星——浙江省某市区视频能力中心

星环科技

大数据

高性能、快响应!火山引擎ByteHouse物化视图功能及入门介绍

字节跳动数据平台

大数据 数据仓库 云原生 Clickhouse 企业号 4 月 PK 榜

用C++编写一个简单的发布者和订阅者

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 4 月 PK 榜

算法题每日一练:连续子数组的最大和

知心宝贝

数据结构 算法 前端 后端 三周年连更

Wallys/DR7915/MT7915/MT7975/industrial mini pcie card /support openwrt

Cindy-wallys

MT7975 MT7915

Spring Cloud Stream:打造强大的微服务事件驱动架构

Java 微服务 spring cloud stream

什么是存算分离架构?

星环科技

存算分离

【获奖案例巡展】科技向善之星——中航电梯5G+大数据管理平台

星环科技

大数据管理

支持多模型数据分析探索的存算分离湖仓一体架构解析(下)

星环科技

湖仓一体

厦门等保备案平台是哪个?多久可以办好?

行云管家

等保备案 厦门

共建清洁能源岛!华为中国数字能源旗舰峰会海南站盛大举行

极客天地

火山引擎DataTester智能发布平台:智能化A/B实验,助力产品快速迭代

字节跳动数据平台

大数据 AB testing实战 A/B 测试 企业号 4 月 PK 榜

c4d R2023 让您的三维动画设计更简单~~

真大的脸盆

Mac Mac 软件 三维动画设计 动画设计工具

火山引擎 DataLeap 下 Notebook 系列文章三:架构升级详解

字节跳动数据平台

大数据 架构 数据治理 运维‘ 企业号 4 月 PK 榜

【Python实战】Python采集大学教务系统成绩单

BROKEN

三周年连更

支持多模型数据分析探索的存算分离湖仓一体架构解析(上)

星环科技

湖仓一体

临沂等级保护测评机构有几家?在哪里?

行云管家

等保 等级测评 临沂

【获奖案例巡展】信创先锋之星——中信证券基于国产图数据库构建企业图谱的应用实践

星环科技

国产数据库

CutMix&Mixup详解与代码实战

华为云开发者联盟

人工智能 华为云 数据增强 华为云开发者联盟 企业号 4 月 PK 榜

SBOM喊话医疗器械网络安全:别慌,我罩你! Part Ⅰ

安势信息

网络安全 SBOM 医疗器械 SBOM应用

灵活、快捷、低运维成本的数据集成方法:数据联邦架构

星环科技

数据集成 数据联邦结构

软件测试/测试开发丨Docker 容器技术与常用命令

测试人

Docker 软件测试 自动化测试 测试开发

最佳实践|如何写出简单高效的 Flink SQL?

Apache Flink

大数据 flink 实时计算

在高校内投放共享电单车有什么优势

共享电单车厂家

共享电动车厂家 景区共享电单车 共享电单车投放 校内共享电单车 共享电单车优势

超级App的构建与技术驱动

没有用户名丶

【获奖案例巡展】信创先锋之星——甘肃省住房和城乡建设厅住建数据大脑

星环科技

数据超脑

分析型数据库:分布式分析型数据库

星环科技

分析型数据库

屌的一批!阿里P8推荐的Spring Cloud实战笔记

小小怪下士

Java 微服务 SpringCloud

内蒙农信携手星环科技建设农信大数据平台,激活金融业务创新

星环科技

数据要素流通

与 Prometheus 搭配使用 Amazon EKS 控制平面指标_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章