阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

如何不停机将数百个 ZooKeeper 实例迁移到 Kubernetes

  • 2020-05-06
  • 本文字数:2347 字

    阅读完需:约 8 分钟

如何不停机将数百个ZooKeeper实例迁移到Kubernetes

最近,我们在不停机的情况下将数百个 ZooKeeper 实例迁移到了 Kubernetes。我们利用了强大的 Kubernetes 特性(例如端点)简化了迁移过程,那些想要跟我们一样进行 Zookeeper 迁移的人可以在这篇文章里找到答案。文章的末尾列出了进行迁移所需的网络条件。

传统的 ZooKeeper 迁移方法

ZooKeeper 是很多分布式系统的基础,它为这些系统提供了一个强大的平台,让它们可以聚在一起形成集群。它提供了一种比较基础的方法来形成集群:每个服务器实例都有一个配置文件,文件里列出了集群成员的主机名和数字 ID,所有的服务器都有相同的集群成员列表,如下所示:


server.1=host1:2888:3888server.2=host2:2888:3888server.3=host3:2888:3888
复制代码


每台服务器都有一个叫作 myid 的文件,用来指明它在列表中对应的是哪个数字 ID。


集群可以随意添加和移除服务器,只要没有违反这个关键规则:每台服务器必须能够与配置文件中列出的仲裁服务器通信。传统的 ZooKeeper 服务器迁移步骤主要包括:


  1. 启动一台新主机,在服务器列表配置中加入“server.4=host:4…”;

  2. 更新已有主机上的配置文件,添加新的服务器条目,或删除已退役的主机;

  3. 滚动重启旧主机(3.4x 版本分支不提供动态服务器配置功能);

  4. 更新客户端的连接串。


这种方法的缺点是需要修改大量的配置文件并进行滚动重启,这种方式可能无法进行可靠的自动化。在将 ZooKeeper 迁移到 Kubernetes 之前,我们也考虑过这种方法,但后来找到了一种更简单的方法。这种方法更为安全,因为根据我们的经验,每一次新的首领选举都存在一个小风险,就是有可能会让依赖它们的系统崩溃。

新的迁移方法

我们将已有的 ZooKeeper 服务器包装成 Kubernetes 服务,然后使用相同的 ZooKeeper ID 进行从服务器到 Pod 的一对一替换。这只需要一次滚动重启就可以重新配置现有的 ZooKeeper 实例,然后逐一关闭服务器。不过,我们不打算深入讨论如何为 ZooKeeper 配置 Kubernetes 拓扑,也不打算深入讨论底层的状态就绪检查机制,因为有很多方法可以实现这些操作。


我们将分五个步骤进行迁移:


  1. 确保为 ZooKeeper 集群的迁移做好准备;

  2. 在 Kubernetes 中创建 ClusterIP 服务,将 Zookeeper 包装成服务;

  3. 修改 ZooKeeper 客户端,让它们连接到 ClusterIP 服务;

  4. 配置 ZooKeeper 服务器实例,让它们可以基于 ClusterIP 服务地址执行点对点事务;

  5. 通过 Kubernetes Pod 运行 ZooKeeper 实例。


对于下面的每一个步骤,我们都将提供一个基础设施拓扑关系图。为了便于理解,这些图只包含两个 ZooKeeper 实例(在现实当中一般不会创建少于三个节点的集群)。

准备好先决条件

我们从一个可运行的 ZooKeeper 集群开始,确保主机上的服务能够与 Kubernetes 集群通信。文末介绍了几种方法。



图 1:初始状态,一个包含两个实例的 ZooKeeper 集群和一些客户端

创建 ClusterIP 服务

为每个 ZooKeeper 服务器创建一个具有匹配端点的 ClusterIP 服务,可以让客户端端口(2181)和集群内部端口(2888、3888)通过。完成之后,就可以通过这些服务主机名连接到 ZooKeeper 集群。Kubernetes ClusterIP 服务在这个时候很有用,因为它们提供了可以作为后端 Pod 负载均衡器的静态 IP 地址。我们用它们进行从服务到 Pod 的一对一映射,相当于为每个 Pod 提供了一个静态的 IP 地址。



图 2:可以通过 ClusterIP 服务访问我们的集群(ZooKeeper 仍然运行在物理硬件上)

重新配置客户端

在可以通过 Kubernetes ClusterIP 服务连接到 ZooKeeper 集群之后,接下来就可以重新配置客户端了。如果你在 ZooKeeper 连接串中使用了 CNAME 记录,那么请修改 DNS 记录。如果客户端在连接失败时不会重新解析 DNS 条目,那么就重新启动客户端。如果没有使用 CNAME 记录,那么就需要使用新的连接串,并重新启动客户端。在这个时候,新旧连接串都可以使用。



图 3:客户端现在通过 ClusterIP 服务实例与 ZooKeeper 集群通信

重新配置 ZooKeeper 实例

接下来,我们将让 ZooKeeper 服务器通过 ClusterIP 服务进行点对点通信。为此,我们将结合 ClusterIP 服务的地址来修改配置文件。这里还需要配置 zk_quorum_listen_all_ips 标志,如果没有这个,ZooKeeper 实例将无法成功绑定到主机接口上不存在的 IP 地址,因为它是一个 Kube 服务 IP。


server.1=zk1-kube-svc-0:2888:3888server.2=zk2-kube-svc-1:2888:3888server.3=zk3-kube-svc-2:2888:3888zk_quorum_listen_all_ips: true
复制代码


滚动重新启动这些主机,后面就可以开始准备用 Pod 替换主机了。



图 4:ZooKeeper 实例现在通过 ClusterIP 服务与其他实例通信

使用 Pod 替代 ZooKeeper 主机

我们将进行以下这些步骤,每次操作一台服务器:


  1. 选择一台 ZooKeeper 服务器及其相应的 ClusterIP 服务;

  2. 关闭服务器上的 ZooKeeper 进程;

  3. 使用与被关闭的 ZooKeeper 具有相同服务器列表配置和 myid 文件的 Pod;

  4. 等待,直到 Pod 中的 ZooKeeper 启动,并与其他 ZooKeeper 节点的数据同步。


就这样,ZooKeeper 集群现在运行在 Kubernetes 中,并带有之前所有的数据。



图 5:经过替换后的集群。ZK1 运行在一个 Pod 中,而 ZK2 不需要知道发生了什么

网络先决条件

要顺利完成这些步骤,需要确保一些网络设置符合条件。你需要确保:


  1. 可以从所有需要连接到 ZooKeeper 的服务器重新路由 Kubernetes Pod 的 IP 地址;

  2. 所有连接到 ZooKeeper 的服务器必须能够解析 Kubernetes 服务主机名;

  3. 所有需要连接到 ZooKeeper 的服务器必须运行 kube-proxy,让它们能够访问 ClusterIP 服务。


这些可以通过几种方式来实现。我们使用了一个内部网络插件,类似于 Lyft 的插件,或者 AWS 插件,可以直接将 AWS VPC IP 地址分配给 Pod,而不是使用虚拟叠加网络,所以可以从任意实例重新路由 Pod 的 IP。叠加网络(如 flannel)也是可以的,只要所有的服务器都可以连接到叠加网络。

英文原文

ZooKeeper to Kubernetes Migration


2020-05-06 13:498162
用户头像
小智 让所有人认同的文字称不上表达

发布了 408 篇内容, 共 377.2 次阅读, 收获喜欢 1972 次。

关注

评论

发布
暂无评论
发现更多内容

面试官:说说微服务灰度发布的底层实现?

王磊

Java 面试题

架构设计常见原则

凌晞

架构设计 架构设计原则

15款顶级Bug管理工具全面评测

PingCode

缺陷管理 bug管理 缺陷管理工具

最新推荐!2024年支持私有化的文档管理系统大盘点

PingCode

文档管理 企业文档管理工具 文档管理软件

互联网时代下体育直播平台的四大发展机遇与盈利创新

软件开发-梦幻运营部

融合低代码平台,实现政企业务快速高效加载

鲸品堂

低代码 企业号 3 月 PK 榜

LLM 大模型框架 LangChain 可观测性最佳实践

观测云

LLM #LangChain

活动报名|AutoMQ x 阿里云云原生创新论坛(2024.03.09)见证“新一代云原生 Kafka ”重磅发布!

AutoMQ

kafka 阿里云 云原生 论坛

上云还是下云,最大挑战是什么?对话章文嵩、毕玄、王小瑞

AutoMQ

阿里云 云原生 上云 云上架构

小程序管理平台,企业研发效能提升利器

FinFish

小程序管理平台 小程序管理 小程序开发平台

简单、透明、安全、高度集成!龙蜥可信 SBOM 能力探索与实践

OpenAnolis小助手

开源 安全 操作系统 龙蜥社区 SBOM

ChatGPT 新增朗读功能;微软 Win11 鼠标悬停自动打开 Copilot 丨 RTE 开发者日报 Vol.158

声网

已解决com.netflix.hystrix.exception.HystrixRuntimeException ERROR SimpleMessage Hystrix的正确解决方法,亲测有效!!!

小明Java问道之路

Shopify 性能优化探索与落地

飞书深诺技术团队

性能优化 前端 建站 Shopify

GreptimeDB v0.7 发布 — 全面支持云原生监控场景

Greptime 格睿科技

数据库 开源 云原生 版本 时序数据

和鲸科技受邀参与湖南省气象信息中心开展人工智能研究型业务支撑平台学术交流

ModelWhale

人工智能 机器学习 大数据 气象 地球科学

NFTScan :什么是 ERC-404?深入解读 NFT 协议的未来

NFT Research

ERC20 NFT ERC721 NFTScan

加密货币牛市会持续多久?

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

软件测试学习笔记丨JMeter性能测试工具 - 参数化介绍

测试人

软件测试

【干货】鞋服品牌商品部如何制定合理的售罄目标

第七在线

StarkNet新手入门教程:教你用bitget 钱包入门

石头财经

StarkNet新手入门教程:教你用bitget 钱包入门

大瞿科技

安全SCDN有什么效果

德迅云安全杨德俊

【鸿蒙开发】在ArkTS线程中通过napi创建的C++线程返回处理结果

贺公子之数据科学与艺术

喜报|3DCAT成为国内首批适配Vision Pro内容开发者

3DCAT实时渲染

实时云渲染

Starknet 最好的钱包是什么?

BlockChain先知

语义化与自动化——第三代指标平台两大核心能力详解(内含Q&A)

Aloudata

ETL 指标

2024上海国际智能机器人展览会

AIOTE智博会

工业机器人展会 机器人展

【教程】uni-app iOS打包解决profile文件与私钥证书不匹配问题

搭个ChatGPT算法模型,离Java程序员有多远?

京东科技开发者

StarkNet新手入门教程:教你用bitget 钱包入门

股市老人

如何不停机将数百个ZooKeeper实例迁移到Kubernetes_容器_Paul Furtado_InfoQ精选文章