阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

Heroku 的自动化持续部署之旅

  • 2019-12-07
  • 本文字数:1623 字

    阅读完需:约 5 分钟

Heroku 的自动化持续部署之旅

Heroku 工程团队记录了他们利用 Heroku 运行时Heroku Runtime)从手动部署到自动化持续部署的过程,Heroku 运行时是他们的应用程序托管环境。他们使用 Heroku 原语和自定义部署工具实现了这一目标。


Heroku 运行时团队可以构建和运维单一(私有空间,Private Space/PS)及多租户(公共运行时,Common Runtime/CR)环境。这包括容器编排、路由和日志记录。在此之前,该团队需要遵循的部署流程是由多个手动步骤组成的,包括主要值班工程师的签字、预留足够的缓冲区以监控部署后的情况以及对多个仪表板的监控。如果还需要部署其他区域和服务,则必须等到该次部署全部稳定之后,这也会带来相应的开销。由于当时团队规模较小,并且服务和区域仅限于美国和欧盟 2 种生产环境,所以这种方法是可行的。随着团队成员数量的增加以及将 CR 重新构建成一个面向多服务的长期项目,团队必须进行自动化实践并构建一个可以自动化部署工具。


InfoQ 联系了 Heroku 的主要技术人员 Bernerd Schaefer, 以进一步了解他们所面临的挑战以及相应解决方案的细节。


之前的流程依赖于团队的规模和对预期效果的详细手动计划。Direwolf 是一个测试平台,它可以上报跨区域的状态。当团队成员增加到 30 多人时,这个过程会变得很繁琐。再加上 CR 管理架构改造(将 CR 的单体 Ruby 应用程序分割成多服务)的挑战。团队决定推行完全自动化。该应用程序在两个生产环境中运行,手动步骤会导致更高的协调成本。


团队的解决方案是使用现有的 Heroku 原语和一个名为 cedar-service-deployer 的自定义工具。每个服务都会成为管道(Pipeline)的一部分,并且共享服务作为长期项目的一部分部署在跨多个预生产(staging)和生产(prod)环境中。cedar-service-deployer tools 工具是使用 Go 编写的,它可以扫描管道以发现不同阶段之间的差异。如果扫描到任何差异,它将运行检查程序以查看是否可以将代码提交到下一个阶段。这些检查包括发布时间、足够的集成测试时间、正在运行的事件(incident)、正在触发的告警、只能从主干分支进行升级等。Schaefer 说到,添加新检查需要变更代码,因为该列表是固定的。同时,他还解释到,团队可以配置自己的告警:


团队可以配置单个服务所需要检查的服务项,特别是要监控哪些告警以确定服务的健康状况。例如,某个服务可能有一个告警是用来检查服务是否启动的,一个是用来检查其 HTTP 成功率是否超过 99%,向部署程序中添加这些服务的团队可以在 JSON 文件中配置告警,以便对部署程序服务在发布期间进行监控。


监控和告警是部署的重要组成部分,因为它们可以指出可能存在的问题。Heroku 使用 Librato 收集度量指标和告警。Schaefer 说,还有一些其他的系统也可以进行监控,但是到目前为止,部署程序所控制的所有服务都是使用的 Librato。


Schaefer 进一步阐述了他们的监控理念:


我们一直在推动的一件事情是将监控引入到我们的标准服务工具包中,以便每个服务在默认情况下都具有有用的工具。当然,随着服务投入生产并进入成熟阶段,它们可能需要一些定制的工具。但是我们的目标是,服务开发人员可以专注于他们服务所提供的功能,并成为对应功能的专家,而无需成为度量指标收集、跟踪或其他我们想知道的系统运行情况的专家。


尽管在大多数情况下,部署程序可以自动决定是否推送,但是我们仍提供了手动覆盖的规则。Schaefer 解释道:


系统总是允许运维人员使用现有的手动工具来进行发布。我们可能会在事件期间执行此操作,以便将关键的热修复程序补丁发布到受影响的环境中。在一个事件中,很少还会推送其他的变更,因为如果有某项事件正在进行中的话,我们会尽力减少其他对生产环境的变更,而且人们很少会急于将产品发布上去,但是如果需要的话,这种能力也是存在的。


部署程序的无状态特性意味着它的工作方式可以尝试在管道中任意两个阶段之间进行升级,而不是绑定到单个“发布”版本上。这使得多个提交点可以同时出现在部署管道的不同阶段。


原文链接:


Heroku’s Journey to Automated Continuous Deployment


2019-12-07 08:003890

评论

发布
暂无评论
发现更多内容

PassJava 初始化项目和添加微服务

悟空聊架构

ndk开发环境,个人开发者做一款App需要知道的事情,绝对干货

欢喜学安卓

android 程序员 面试 移动开发

手把手教你写一个经典躲避游戏

HZFEStudio

大前端 游戏 canvas

亲爱的开发者,您收到一个启动智能世界的魔方

白洞计划

合约交易所跟单,合约跟单社区开发

用C++ 和OpenCV 实现视频目标检测(YOLOv4模型)

博文视点Broadview

区块链食品溯源--为食品溯源认证

13530558032

LeetCode题解:73. 矩阵置零,栈,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

mmkv跨进程,面试字节跳动Android研发岗,灵魂拷问

欢喜学安卓

android 程序员 面试 移动开发

如何推进一个“以行动为导向的”事件驱动架构?

VoltDB

数据库 数据分析 实时数据分析 事件驱动架构

NumPy之:标量scalars

程序那些事

Python 数据分析 Numpy 程序那些事 scalar

闲来无事,写脚本,install_wordpress

ilinux

编程实战:如何管理代码里的常量

华为云开发者联盟

常量 代码 web开发 final常量类 复用常量

Pytorch数据加载

Sakura

4月日更

RocketMQ NameServer工作原理与源码解析

HByte

RocketMQ

源中瑞智慧党建系统,打造党建管理系模式

13530558032

区块链电子签章应用平台--助推企业数字化转型升级

13530558032

使用 rocketmq-spring-boot-starter 来配置、发送和消费 RocketMQ 消息

阿里巴巴云原生

容器 开发者 云原生 中间件 API

新思科技发布《疫情中的安全隐患:移动应用程序安全现状》报告

InfoQ_434670063458

App 新思科技 移动应用程序安全

量化策略系统搭建,马丁策略交易

面对大规模 K8s 集群,如何先于用户发现问题?

阿里巴巴云原生

容器 云原生 k8s 监控 调度

架构实战营 - 架构设计文档模板

华仔

架构设计 文档模板

40个问题让你快速掌握Java多线程的精髓

华为云开发者联盟

Java 多线程 synchronized Thread Semaphore

B站HR炫耀资产、贬低面试者?无独有偶,校招污点事件记录帮你避雷

北游学Java

Java 面试

扩展 GRTN:云原生趋势下的 RTC 架构演进

阿里云视频云

阿里云 云原生 RTC SRS流媒体服务器

边缘计算加持下的智慧社区

浪潮云

边缘计算

浅谈BSS3.0产品“守成”之策下 • 运维提升篇

鲸品堂

软件 运维 提升

Coinbase上市意味着什么?

猫Buboo

游戏测试-战斗内核的自动化测试

行者AI

人工智能

马斯克的狗狗币实验

猫Buboo

What's new in dubbo-go v1.5.6

阿里巴巴云原生

开发者 云原生 dubbo 中间件 Go 语言

Heroku 的自动化持续部署之旅_软件工程_Hrishikesh Barua_InfoQ精选文章