写点什么

Dropbox 的服务器和网络自动化运维实践

  • 2019-01-29
  • 本文字数:1087 字

    阅读完需:约 4 分钟

Dropbox的服务器和网络自动化运维实践

Dropbox 的工程团队写了一篇有关他们的网络和服务器配置和验证自动化工具 Pirlo 的文章。Pirlo 提供了一种可插拔架构,基于 MySQL 实现了一种自定义作业队列。


Dropbox 有自己的数据中心。Pirlo 工具由 TOR(机架顶部)交换机初始化程序、服务器配置程序和验证程序组成。它作为工作进程运行在一个通用的分布式作业队列上,这个队列基于 MySQL,提供了可用于跟踪运行作业进度和可视化历史数据的 UI。Pirlo 使用了可插拔模块,为每个阶段提供了大量日志记录,用于调试和分析自动化运行。Dropbox 有一个 NRE(网络可靠性工程)团队,负责构建、自动化和监控生产环境的网络。Dropbox 的大多数代码都是用 Python 编写的,不过目前还不清楚 Pirlo 是否也是用 Python 编写的。


交换机和服务器配置程序都使用了作业队列,它们的工作流程都很相似,队列管理器选择正确的作业处理程序来处理来自客户端的请求。作业处理程序运行已注册的插件,这些插件负责执行实际的检查和命令。插件执行特定的作业,发出状态码,并将状态发布到数据库日志。这是大多数作业队列的运行方式,因此很自然地就会有人问为什么这个团队没有选择像 Celery 这样的现有队列解决方案。文章的作者解释说:


我们不需要整个功能集,也不想要第三方工具的复杂性。内部原语为我们提供了更大的设计灵活性,一小组 SRE 就足以开发和运营 Pirlo 服务。


当收到客户端请求时,交换机配置器(叫作 TOR 启动器)就会启动。TOR 交换机是网络设计的一部分,机架上的服务器设备与同一机架上的网络交换机相连,网络交换机通常位于顶部。它尝试通过 gRPC 使用服务发现找到健康的服务器,然后队列管理器为该作业选择一个作业处理程序。交换机验证和配置是一个多步骤过程,从建立基本的连接开始。随后会执行各个插件,最终下载交换机配置并重启。


服务器配置和验证过程类似。我们使用 Debirf 创建的操作系统镜像启动验证器,这个操作系统镜像可以创建基于 RAM 的文件系统,完全从内存运行 Debian 系统。它的绰号叫 Hotdog,一个基于 Ubuntu 的镜像,可以通过网络启动并运行验证、基准测试和压力测试。测试结果被推送到数据库,并用于后续的分析。测试过程包括根据硬件工程团队批准的预定义配置列表验证各种硬件和固件组件。修好的机器在重新投入生产之前也需要经过这个测试套件的测试。


Pirlo 的 UI 显示了当前正在运行和已完成的作业的进度。Dropbox 曾经使用 playbooks(或 runbooks)来执行配置。其他一些工程团队运行自己的数据中心,他们也已经从基于 runbook 的配置转向零接触配置(ZTP),尽管使用了不同的方法。


查看英文原文:


https://www.infoq.com/news/2019/01/dropbox-datacenter-automation


2019-01-29 11:005280
用户头像

发布了 731 篇内容, 共 468.0 次阅读, 收获喜欢 2006 次。

关注

评论

发布
暂无评论
发现更多内容

CompletableFuture 使用指南

FunTester

小间距LED:数字标牌成新宠

Dylan

媒体 娱乐 信息 LED display LED显示屏

淘宝商品详情数据接口全攻略:如何高效获取与分析商品信息

tbapi

淘宝商品详情数据接口 淘宝API接口 淘宝商品详情数据采集 淘宝商品详情数据分析

Java 学习

玄兴梦影

学习 java

2024年移动端技术探索

轻口味

android 移动端

金融机构如何打击帮信罪和掩饰罪?

芯盾时代

风险管理 反欺诈 账户安全 金融风控

AI日报|英伟达Nemotron-4 340B模型助力各行业数据生成,扣子发起匿名AI模型擂台赛!

可信AI进展

#人工智能

揭秘10亿+高并发应用如何实现高效稳定的开发和运维

华为云开发者联盟

云原生 华为云 智能运维 华为云开发者联盟 企业号2024年6月PK榜

生态共赢|心大陆携手搜狐视频,构建心理健康视听守护者!

心大陆多智能体

人工智能 AI 多模态 心理健康 数字心理

中标新领域!亚信科技+用友网络,将助力广西某市城投集团玩转“人事”

亚信AntDB数据库

AntDB 用友 亚信科技 企业号 6 月 PK 榜

利用淘宝商品详情API接口,实现商品信息的全面监控与分析

技术冰糖葫芦

API 安全 API 文档 API 策略 pinduoduo API

深度解析:基于Pixi渲染引擎打造沉浸式「滑雪竞技」小游戏!

快手技术

前端 H5 快手 pixi 渲染

数据库管理和开发:Navicat 17 for MongoDB mac 激活版

你的猪会飞吗

Mac软件推荐 mac破解软件下载

攀登不止,华为数据库论文入选SIGMOD 2024,技术创新再谱新篇

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号2024年6月PK榜

在 Go 中如何让结构体不可比较?

江湖十年

Go golang golang 面试 编程技巧

【CVPR2024】面向StableDiffusion的编辑算法FreePromptEditing,提升图像编辑效果

阿里云大数据AI技术

人工智能 深度学习 算法 CVPR 图像编辑

Databend 开源周报第 149 期

Databend

Dropbox的服务器和网络自动化运维实践_服务革新_Hrishikesh Barua_InfoQ精选文章