通过改变行为来介绍 DevOps 文化

  • Manuel Pais
  • 陆巍

2012 年 10 月 22 日

话题:精益DevOps

最近DevOps这个词正从高德纳和其他高调的行业参与者那里得到越来越多的注意力,因为它能够缩短上市时间,带来高质量并增加营收。在罗马举办的 DevOps Days 大会上 Damon Edwards 讨论了如何引入 DevOps 文化而不仅仅关注于自动化方面。

Damon 指出,有真正 DevOps 愿景的公司都有以下核心:

  • 系统思维: 从业务概念到技术实现的系统端对端视角,破除开发与运维之间的界限
  • 关注流程: 在整个开发生命周期一直检查产品和工作流转的速度,从而更有效地将业务概念实现为工作服务(working service)
  • 增强反馈环: 对于变更的结果快速反馈,通过反馈才能更快了解系统
  • 持续实践学习: 上述要点的达成正是持续改进与反馈环正确应用的体现

Damon 列举了一系列实践与举措。这些实践与举措在那些成功应用了 DevOps 的组织中已经成为它们日常工作的一部分,从而让它们实现了上述四项核心:

  • 去除“完成”这个词,服务是永不停止的,它们一直在运行并应该得到持续关注
  • 将运维需求与功能需求一样视为一等公民,使运维方能够及早发现需求影响
  • 将工作流程可视化,使所有人对全局有了解,瓶颈自然显现
  • 协同匹配价值流,这样才能理解系统全局并发现浪费
  • 将信息流变为产品流,以降低信息传递中的歧义并澄清人员间必须的交流
  • 将相关数据组合起来形成有意义的指标,让组织中不同利益相关者都能意识到
  • 通过将变更关联到相应指标并将它们图形化来提升对变更的认知
  • 有目的地妆点办公室墙,使每个人都感觉到自己是整个系统的一分子
  • 去中心化管控,让产品的开发者和运维者就责任达成一致(例如:开发者负责代码的正常运行,运维负责平台的正常运行,诸如此类)
  • 举行内部小型会议,大家可以在会上就已经完成和可以完成的事项达成一致,会上也鼓励大家就变更发表自己的意见
  • 强制在运维的帮助下对所有开发提交的服务进行部署验证检查,以避免在运维时才出现问题
  • 释放你的猴子(译者注:Chaos Monkey,是 Netflix 一套用来故意把服务器搞下线的软件,可以测试云环境的恢复能力),这能使你对自己的服务承诺产生巨大的自信
  • 在问题发生时不仅在管内(pipeline flow)流转(要引入更多的变更和工作),而是关注在找到瓶颈发生的真正原因并加以修正
  • 保证对客户透明,在出现问题时勇于担当,在问题解决后保持警惕,客户自然有理由心满意足
  • 在团队和日常工作流以外建立良好关系,例如通过“Guess the Admin”游戏或与公司内不同的人一起共进午餐

Damon 与其他思想领袖正致力于DevOps Cookbook 的编纂,这本书涵盖了以上内容及其他 DevOps 主题。这次演讲以及DevOps Days 罗马大会上的其他演讲视频可以从这里获取。

查看英文原文: Introducing DevOps Culture by Changing Behavior


感谢崔康对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

精益DevOps