影响K8S Pod分配和调度策略的两大关键特性_文化 & 方法_Rancher



 写点什么

在 Kubernetes 中有一个最复杂的调度器可以处理 pod 的分配策略。基于在 pod 规范中所提及的资源需求，Kubernetes 调度器会自动选择最合适的节点来运行 pod。

但在许多实际场景下，我们必须干预调度过程才能在 pod 和一个节点或两个特定 pod 之间进行匹配。因此，Kubernetes 中有一种十分强大的机制来管理及控制 pod 的分配逻辑。

那么，本文将探索影响 Kubernetes 中默认调度决定的关键特性。

节点亲和性/反亲和性

Kubernetes 一向以来都是依赖 label 和 selector 来对资源进行分组。例如，某服务使用 selector 来过滤具有特定 label 的 pod，这些 label 可以选择性地接收流量。Label 和 selector 可以使用简单的基于等式的条件（=and!=）来评估规则。通过 nodeSelector 的特性（即强制将 pod 调度到特定节点上），可以将这一技术扩展到节点中。

此外，label 和 selector 开始支持基于集合的 query，它带来了基于 in、notin 和 exist 运算符的高级过滤技术。与基于等式的需求相结合，基于集合的需求提供了复杂的技术来过滤 Kubernetes 中的资源。

节点亲和性/反亲和性使用 label 和 annotation 的基于表达集的过滤技术来定义特定节点上的 pod 的分配逻辑。Annotation 可以提供不会暴露到 selector 的其他元数据，这意味着用于 annotation 的键不会包含在 query 和过滤资源中。但是节点亲和性可以在表达式中使用 annotation。反亲和性可以确保 pod 不会被强制调度到与规则匹配的节点上。

除了能够在 query 中使用复杂的逻辑之外，节点亲和性/反亲和性能够为分配逻辑强制施加硬性和软性规则。硬性规则将会执行严格的策略，可能会阻止将 pod 分配到不符合条件的节点上。而软性规则则会首先确认节点是否与特定的条件相匹配，如果它们不匹配，它将使用默认的调度模式来分配 Pod。表达式 requiredDuringSchedulingIgnoredDuringExecution 和 preferredDuringSchedulingIgnoredDuringExecution 将会分别执行硬性规则和软性规则。

以下是在硬性和软性规则下使用节点亲和性/反亲和性的示例：

affinity:  nodeAffinity:    preferredDuringSchedulingIgnoredDuringExecution:      nodeSelectorTerms:        - matchExpressions:          - key: "failure-domain.beta.kubernetes.io/zone"            operator: In            values: ["asia-south1-a"]

复制代码

以上规则将指示 Kubernetes 调度器尝试将 Pod 分配到在 GKE 集群的 asia-south1-a 区域中运行的节点上。如果没有可用的节点，则调度器将会直接应用标准的分配逻辑。

affinity:  nodeAffinity:    requiredDuringSchedulingIgnoredDuringExecution:      nodeSelectorTerms:        - matchExpressions:          - key: "failure-domain.beta.kubernetes.io/zone"            operator: NotIn            values: ["asia-south1-a"]

复制代码

以上规则通过使用 NotIn 运算符来强制执行反亲和性。这是一个硬性规则，它能够确保没有 pod 被分配到运行在 asia-south1-a 空间中的 GKE 节点。

Pod 亲和性/反亲和性

尽管节点亲和性/反亲和性能够处理 pod 和节点之间的匹配，但是有些场景下我们需要确保 pod 在一起运行或在相同的节点上不运行 2 个 pod。Pod 亲和性/反亲和性将帮助我们应用强制实施粒度分配逻辑。

与节点亲和性/反亲和性中的表达式类似，pod 亲和性/反亲和性也能够通过 requiredDuringSchedulingIgnoredDuringExecution 和 preferredDuringSchedulingIgnoredDuringExecution 强制实施硬性以及软性规则。还可以将节点亲和性与 pod 亲和性进行混合和匹配，以定义复杂的分配逻辑。

为了能够更好地理解概念，想象一下我们有一个 web 和缓存 deployment，其中三个副本在一个 3 节点的集群中运行。为了确保在 web 和缓存 pod 之间低延迟，我们想要在用一个节点上运行它们。与此同时，我们不想在相同的节点上运行超过 1 个缓存 pod。基于此情况，我们需要实施以下策略：每个节点仅运行 1 个且只有 1 个缓存 Pod 的 web pod。

首先，我们将使用反亲和性规则来部署缓存，它将阻止超过 1 个 pod 运行在 1 个节点上：

      affinity:        podAntiAffinity:          requiredDuringSchedulingIgnoredDuringExecution:          - labelSelector:              matchExpressions:              - key: app                operator: In                values:                - redis            topologyKey: "kubernetes.io/hostname"

复制代码

topoloyKey 使用附加到节点的默认 label 动态过滤节点的名称。请注意，我们使用 podAntiAffinity 表达式和 in 运算符来应用规则的方式。

假设在集群的某个节点上安排了 3 个 pod 缓存，那么现在我们想要在与缓存 Pod 相同的节点上部署 web pod。我们将使用 podAffinity 来实施这一逻辑：

        podAffinity:          requiredDuringSchedulingIgnoredDuringExecution:          - labelSelector:              matchExpressions:              - key: app                operator: In                values:                - redis            topologyKey: "kubernetes.io/hostname"

复制代码

以上代码表明 Kubernetes 调度器要寻找有缓存 Pod 的节点并部署 web pod。

除了节点和 pod 的亲和性/反亲和性之外，我们还能使用 taints 和 tolerations 来定义自定义分配逻辑。此外，我们还能写自定义调度程序，它可以从默认的调度程序中接管调度逻辑。

发布

暂无评论

创作场景

影响 K8S Pod 分配和调度策略的两大关键特性

节点亲和性/反亲和性

Pod 亲和性/反亲和性

评论

淘宝/天猫商品API：实时数据获取与安全隐私保护的指南

快速实践: 通过 Flink CDC 一键整库同步 MongoDB 到 Paimon

探索前端开发趋势：2023年的新兴技术与发展方向

软件开发

苹果证书p12和描述文件的创建方法

"云原生：构建未来应用的革命性方法"

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

国内如何充值 openai API key 详细教程

软件测试/测试开发丨接口测试学习笔记

低代码：拒绝重复、低价值的工单循环开发

铭文挖矿系统

解锁加密生态：用户钱包画像分析

分页合理化是什么？

云智·智算大会|大模型安全解决方案持续升级

零基预算：从零开始的财务计划与预算管理

1.4亿人都在用｜伊对APP x 阿里云PolarDB：这一对，天生配

百度点石行业实践成果获选2023信通院大数据“星河”优秀案例

亚马逊云科技 re:Invent 2023 产品体验：亚马逊云科技产品应用实践王炸产品 Amazon Q，你的 AI 助手

有什么好用的C/C++源代码混淆工具？

通过Environment获取属性文件的值，竟然会调用到JNDI服务！！！| 京东云技术团队

LangChain初学者指南

阿里巴巴中国站1688商品评论API：实时数据获取与应用的探索

创作场景

影响 K8S Pod 分配和调度策略的两大关键特性

节点亲和性/反亲和性

Pod 亲和性/反亲和性

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载