写点什么

Slack 对 Chef 架构进行改进,提高其安全性和稳定性

作者:Matt Saunders

  • 2024-11-29
    北京
  • 本文字数:1393 字

    阅读完需:约 5 分钟

Slack 对 Chef 架构进行改进,提高其安全性和稳定性

在近期的一篇博文中,Slack 的工程部详细介绍了他们在 Chef 基础架构上的重大改进,将管理着上万个 EC2 实例中运行的服务、数据库和应用程序的架构从单一的 Chef 堆栈转移为了弹性更强的分片基础架构。


这次的架构转移,Slack 希望能解决一些之前难以解决的限制问题:


  • 为节点分配分片

  • 发现周围邻居

  • 找寻 Chef

  • 上传常用代码合集(Cookbook)


在先前的设置中,Slack 是在沙盒、开发和生产这三个环境中使用一个 Chef 栈。这种架构风险很高,因为更改是会在不同环境中同时部署的,堆栈中的任何问题都可能影响整个基础架构。这套系统是用一个叫 DishPig 的流程来处理每小时触发的 cookbook 更新。



为了解决这些限制,工程团队进行了以下几项关键改动:首先是创建多个 Chef 堆栈,以便于分散负载并确保系统的弹性,新的实例采用 AWS Route53 加权 CNAME 记录并分配给特定分片。此外,Slack 工程团队还将开发和生产环境的 Chef 基础架构分离成不同的堆栈。


为解决在新分片基础架构中发现节点的难题,Slack 工程团队采用了 Consul 来做服务发现。这点需要仔细地实施,从而避免与 Nebula 重叠网络之间产生循环依赖关系。团队开发了定制的 Chef 库函数,从而简化基于各种条件的节点查询,有效地取代了先前的 Chef 搜索功能。


Slack 还创建了一项名为 Shearch(“分片 Chef 搜索”的简称) 的新服务,用于在多个 Chef 堆栈中进行搜索,还可以整合在不同分片上的搜索结果。Slack 团队还开发了一项叫做 Gnife 的新工具,取代传统 Chef Knife 命令来实现跨多个分片的操作。


团队采用 Chef Librarian 取代了 DishPig 系统,这项服务可以独立管理 cookbook 的版本和环境更新,从而实现更为可控的部署。在合并变更时,GitHub Actions 会生成一个包含全部代码库副本的压缩包,并用时间戳格式(YYYYMMDD.TIMESTAMP.0)更新 cookbook 的版本。


Chef Librarian 提供了更新环境到特定版本和环境相互匹配功能的 API 端点,利用 Chef Librarian,Slack 可以在沙盒和开发环境中对更改进行测试,然后再推送到生产环境,从而降低了出问题的更改影响所有环境的风险。这项服务会将工作版本和部署信息存储到 DynamoDB 中,可以更为方便地跟踪和查看。



当用户的变更被推送到环境中时,Slack 应用会通知用户并使用 Git 中的 commit 备注判断并标注对应的团队成员。Kubernetes CronJob 负责跨环境的版本推送和安全检查,以便在发现问题时阻止推送。


Slack 将角色简化到基本信息和运行列表,让 Chef 角色(无法通过版本控制)的风险降到最低。只有在相关环境更新时,角色才会上载到相关的 Chef 堆栈中。


Slack 在考虑更进一步地改进其 Chef 基础设施,其中一项是按照 AWS 可用性区域划分生产的 Chef 环境,这样可以对变更的部署进行更为细粒化的控制。Slack 还在探索采用 Chef PolicyFiles 和 PolicyGroups 的可行性,不过这将会对他们当前的设置带来巨大的改变。


和十年前的风光不同,Chef 不再是那么地受欢迎,这可能是由于 Ansible 和其他云原生解决方案等替代品的兴起。IT 行业向容器化的转变改变了许多企业的配置管理方式,多数企业转投了 Kubernetes 和 Docker 的怀抱。Chef 在 2020 年被 Progress Software 收购可能也影响了它在长期的采用率。


即使如此,Chef 仍然拥有坚实的用户基础,这在已实施了 Chef 或者是有适合 Chef 方法的特定用例的组织中尤为突出。


查看英文原文链接:

https://www.infoq.com/news/2024/10/slack-chef-architecture/

2024-11-29 08:157772

评论

发布
暂无评论

如何用Redis高效实现点赞功能?用Set?还是Bitmap?

左诗右码

Astherus:基于真实收益,唤醒 LRT 赛道的第二春

股市老人

【喜报】矩阵起源在2024年中国创新创业大赛斩获多个奖项!

MatrixOrigin

AI 大底座 创新创业大赛

悦数图数据库 v5.0 及悦数 RAG 正式发布:引领标准化,激发新动能

最新动态

ETLCloud支持的数据处理类型包括哪些?

RestCloud

数据库 数据处理 ETL 数据集成

借助 1688 拍立淘 API 接口,解锁以图找货的无限可能

tbapi

图片搜索商品接口 1688拍立淘接口 以图识货接口

IPLC、IEPL和MPLS的对比分析

Ogcloud

MPLS 企业组网 企业网络 IPLC IEPL

World Clock Deluxe for Mac(世界时钟豪华版)v4.19.3注册版

iMac小白

NFTScan | 11.04~11.10 NFT 市场热点汇总

NFT Research

NFT\ NFTScan

CachedThreadPool线程池设计/场景案例/性能调优/场景适配(架构篇)

肖哥弹架构

Java 并发编程 高并发

VMware Tanzu CLI 1.5.0 - VMware Kubernetes 发新版的命令行工具

sysin

Kubernetes Tanzu

【JIT/极态云】技术文档--聚合表

武汉万云网络科技有限公司

Web3 游戏周报(11.03 - 11.09)

Footprint Analytics

链游

离散元仿真技术加速工业自动化发展,助力企业数字化转型

Altair RapidMiner

制造业 仿真 DEM altair 离散元

火山引擎边缘云项目管理部荣获 PMI 年度杰出 PMO 奖

火山引擎边缘云

项目管理 边缘计算 PMO #项目管理

IK Multimedia T-RackS 6 MAX For mac (混音和母带制作软件)v6.1.0激活版

iMac小白

权限系统:一文搞懂功能权限、数据权限

EquatorCoco

大数据 架构 权限

HCL AppScan Standard 10.7.0 发布下载,新增功能介绍

sysin

AppScan

释放创作潜力!Flux 模型现已集成至 ComfyUI,快来体验!

MatrixOrigin

数据库 AI 大底座 AI 图像生成

怎么绘制服务蓝图?10个服务蓝图模板盘点推荐!

职场工具箱

职场 画图软件 在线白板 画图 服务蓝图

MatrixOne v2.0.0 release note

MatrixOrigin

数据库 矩阵起源 MO

香港 Web3 一周大事记: 胜利证券计划年底前在香港推出虚拟资产结构性产品及稳定币收益产品

TechubNews

赛事转播权怎么拿?从版权获取到直播平台开发全流程揭秘

软件开发-梦幻运营部

深入理解Java对象结构

不在线第一只蜗牛

Java C#

破解低效数字化:JNPF打造数字商业新基建

不在线第一只蜗牛

低代码 数字化

项目管理平台哪个好?9款优质系统推荐

爱吃小舅的鱼

项目管理 项目管理工具 项目管理软件

Metasploit Pro 4.22.5-2024102801 发布下载,新增功能简介

sysin

Metasploit

云手机群控和传统群控有什么区别?

Ogcloud

云手机 海外云手机 云手机群控 手机群控

redisson内存泄漏问题排查

快乐非自愿限量之名

Java JVM 内存

Greenplum 可观测最佳实践

观测云

greenplum

【项目场景】请求数据时测试环境比生产环境多花了1秒是怎么回事?

威哥爱编程

Java 数据库 JavaEE

Slack 对 Chef 架构进行改进,提高其安全性和稳定性_架构_InfoQ精选文章