写点什么

Kuberhealthy:综合测试 Kubernetes 集群

作者:K Jonas

  • 2019-05-17
  • 本文字数:1645 字

    阅读完需:约 5 分钟

Kuberhealthy:综合测试Kubernetes集群

Comcast开发的开源解决方案Kuberhealthy,通过在 Kubernetes 集群中执行综合测试来检测Kubernetes问题。Kuberhealthy 通过 JSON 状态页面和Prometheus指标端点报告测试结果,为 Kuberhealthy 指标提供灵活的告警选项。


通过复制实际 Kubernetes 工作流,Kuberhealthy 尝试识别那些可能会被忽视的生产问题。Kuberhealthy 检测到的潜在问题包括:由于 CNI 通信故障而陷于“Terminating”状态的 pod、由于磁盘配置错误而陷于“ContainerCreating”状态的 pod,或者重启速度过快的 pod。为了识别这类问题,Kuberhealthy 并行运行以下检查:


  • Daemonset 部署和终止:该测试把 daemonset 部署到 Kuberhealthy 命名空间,等待所有 pod 达到“Ready”状态,终止这些 pod,并确保终止成功。

  • 组件健康状态:检查集群组件状态的现状,如果状态停机超过 5 分钟就告警。

  • 过多的 pod 重启:监控一个 pod 在提供的命名空间是否一小时内重启超过 5 次,默认为 kube 系统。

  • Pod 状态:检查那些超过 10 分钟且不处于“Ready”状态的 pod。

  • DNS:检查集群内外的 DNS 故障


计划对未来版本进行其他测试,包括:服务配置、DNS 解析和磁盘配置。


如果任何一个 Kuberhealthy 测试发生了错误或故障,那么,错误细节将在 http://kuberhealthy.kuberhealthy 上报告一个 JSON 状态页。该状态页面包含一个布尔类型的 OK 字段(用于指示 Kuberhealthy 状态),以及一些 JSON 对象(用于表述每次 Kuberhealthy 检查的检查细节),其中包括一个列出所有潜在错误描述的错误数组。有关检查的其他信息(如上次检查的运行时间)也可以在检查细节对象中找到。


 {  "OK": true,  "Errors": [],  "CheckDetails": {    "ComponentStatusChecker": {      "OK": true,      "Errors": [],      "LastRun": "2018-06-21T17:32:16.921733843Z",      "AuthoritativePod": "kuberhealthy-7cf79bdc86-m78qr"    },    "DaemonSetChecker": {      "OK": true,      "Errors": [],      "LastRun": "2018-06-21T17:31:33.845218901Z",      "AuthoritativePod": "kuberhealthy-7cf79bdc86-m78qr"    },    "PodRestartChecker namespace kube-system": {      "OK": true,      "Errors": [],      "LastRun": "2018-06-21T17:31:16.45395092Z",      "AuthoritativePod": "kuberhealthy-7cf79bdc86-m78qr"    },    "PodStatusChecker namespace kube-system": {      "OK": true,      "Errors": [],      "LastRun": "2018-06-21T17:32:16.453911089Z",      "AuthoritativePod": "kuberhealthy-7cf79bdc86-m78qr"    }  },  "CurrentMaster": "kuberhealthy-7cf79bdc86-m78qr"}
复制代码


来自 Kuberhealthy README.md的状态页示例


Kuberhealthy 可以和Helm或 yaml 规范文件一起安装,仅在集群中可用。一旦完成安装,Kuberhealthy 会运行两个实例,其中包括pod中断预算滚动更新策略,以确保高可用性。Kuberhealthy 提供 Prometheus服务监控器配置以和 Prometheus 告警以及安装Grafana控制面板的模板进行集成。


Comcast 开发了 Kuberhealthy 以满足监控其Kubernetes集群健康状况和稳定性的需要,并和现有监控工具(如 Prometheus)进行了集成。通过模拟实际工作负载,Kuberhealthy 给 Comcast 提供了更健壮的 Kubernetes 监控解决方案。


监控 Kubernetes 集群健康状况的其他方法包括:Kubernetes 工具kubelet,它聚合了 pod 资源使用状况统计数据,以及cAdvisor,它负责收集 CPU、内存、文件系统和网络使用情况统计数据。Grafana 提供一个插件以通过 Prometheus 收集和可视化这些指标。除了 Kubernetes 工具之外,kube状态指标添加了对 Kubernetes API 服务器的侦听,收集关于各个对象(如部署、节点和 pod)健康状况的指标。与 Kuberhealthy 类似,这些指标以明文形式报告给指标端点,该指标端点可以与 Prometheus 进行集成。


请遵循安装指南或在Kubernetes Slack的 Kuberhealthy 频道中了解更多信息以开始使用 Kuberhealthy。


阅读英文原文:Kuberhealthy: Synthetic Testing for Kubernetes Clusters


2019-05-17 08:005671
用户头像

发布了 199 篇内容, 共 88.5 次阅读, 收获喜欢 295 次。

关注

评论

发布
暂无评论
发现更多内容

服务端性能测试:行业流行性能监控工具介绍

测吧(北京)科技有限公司

测试

内推失败!

王磊

项目

阿里云 SAE 助力修正商城 3 周内提升系统承载能力 20 倍,轻松应对春晚流量

阿里巴巴云原生

阿里云 Serverless 云原生

MobPush 安卓推送消息数据解析推荐实现

MobTech袤博科技

Java 开发者 产品动态

战略资讯 | TapData 牵手思想科技,开启数据管理新篇章!

tapdata

Tapdata 现代数据栈 思想科技 数字化解决方案

区块链项目包装孵化都包含哪些东西,一站式了解不迷路!

区块链项目一站式包装孵化

全过程的区块链项目包装孵化都包含啥?

区块链项目一站式包装孵化

成为海量数据管理支柱:天谋科技与中科驭数完成兼容性互认证

Apache IoTDB

2024年ONLYOFFICE插件开发大赛已启动!

科技汇

高效存储的秘诀:bitmap 数据结构在标签中的应用

袋鼠云数栈

数据结构 BitMap 标签 用户画像 标签体系

区块链项目如何包装?点击查看详细流程

区块链项目一站式包装孵化

WAIC2024 | 澳鹏Appen期待与您共襄盛会!

澳鹏Appen

世界人工智能大会 WAIC

手把手教你玩转 Nginx 配置

伤感汤姆布利柏

公开课 | 提高测试用例编写效率,掌握经典用例设计技巧!

测吧(北京)科技有限公司

测试

1688商品详情数据接口

tbapi

1688 1688API 1688商品详情数据接口 1688商品数据采集

软件测试学习笔记丨JUnit5动态测试规则

测试人

软件测试

开源即正义,3D软件Blender设计指南

inBuilder低代码平台

开源 体验

代币怎么上头像logo图标?TP钱包怎么上头像?技术帖扫盲(ave头像tp头像)

区块链项目一站式包装孵化

ai工具有哪些?国内外40款主流AI软件速览!

彭宏豪95

人工智能 职场 在线白板 AIGC AI生成PPT

淘宝/天猫商品详情API接口在电商数据整合中的作用

技术冰糖葫芦

API Explorer API 编排 API 文档

MobPush最佳实践——华为厂商离线消息排查

MobTech袤博科技

开发者,产品动态,java

TapData 医疗美容行业数字化白皮书上线

tapdata

医疗美容机构数字化 医疗美容运营数据分析 医疗美容白皮书 医疗美容大数据中心

MobPush扩展业务功能设置

MobTech袤博科技

Java 开发者 产品动态

败诉的爱奇艺,又引起了网友的不满?

趣解商业

优酷 爱奇艺 腾讯视频

AR没前景?我不相信!

AR玩家

AR Rokid Vision pro 炬目AR

智能制造背景下的低代码平台助力企业生产流程优化

不在线第一只蜗牛

低代码 制造业 智能化

新能源汽车车载充电机仿真技术,实验误差5%以内

Altair RapidMiner

汽车 仿真 altair 人工智能、

Kuberhealthy:综合测试Kubernetes集群_软件工程_InfoQ精选文章