阅读数:3940 发布于:2020 年 1 月 13 日 12:00

更多 架构、微服务、最佳实践 相关课程,可下载【 极客时间 】App 免费领取 >

评论

发布
暂无评论
  • 来自 Netflix 的系统高可用建议

    这篇文章总结了多年来Netflix积累的各种技巧和最佳实践。他们的方法是尽可能围绕这些最佳实践构建工具。他们始终把提高服务可用性作为目标。在真正需要人工干预时,他们才会介入,否则就不插手。工程师的时间用在了那些可以提高可用性的任务上,而在不需要他们参与的情况下,他们可以专注其他事情。

    2018 年 8 月 9 日

  • 全新 AWS Auto Scaling – 适用于云应用程序的统一扩展

    我已多次谈及服务器及其他云资源的扩展性问题

    2019 年 10 月 30 日

  • 准备 Plan B:如何设计兜底方案?

    我们一起看了很多极致的优化思路,但现实中意外总是难免的。要在秒杀场景下保证系统的高可用性,我们能否设计一个Plan B方案,在最坏情况发生时仍能做到从容应对呢?

    2018 年 10 月 7 日

  • 加餐 | 怎么保障发布的效率与质量?

    LCE 的技术要求与其他的 SRE 成员一样,但这个岗位打交道的外部团队很多,需要有很强的沟通和领导能力。

    2019 年 10 月 22 日

  • Eureka 进阶:健康检查和蓝绿部署

    2018 年 10 月 12 日

  • 高效运维最佳实践:如何做好 On-call 和事故响应?

    许多公司的On-call轮转和事故响应流程都会让团队成员感到紧张、焦虑和痛苦,以至于许多优秀的工程师由于这个原因而拒掉工作。 本文的作者基于其在New Relic的实践经验,向读者介绍了如何创建既能够支持系统的快速增长又高度重视系统的可靠性,同时还能保护开发人员免受戏剧性事故和压力的影响的on-call轮转和事故响应流程。

    2019 年 1 月 9 日

  • 客户服务在企业 DevOps 体系中拥有关键性作用的两大理由

    “客户并不关心我们了解多少,而只关心我们有多在乎。” -戴蒙·理查兹。客户服务是企业机构在实现DevOps文化过程中所必须重视的三大基本原则之一。如今的世界充斥着各类技术解决方案。无论我们抱有怎样的需求,都能够在市场上找到大量足以起效的方案选项。对于那些专门负责交付技术解决方案的朋友,良好的工作成果意味着我们不仅需要提供出色的产品,同时也要提供理想的客户服务。客户服务的水平越高,客户从竞争对手处物色替代性产品的可能性也就越低。

    2015 年 8 月 31 日

  • 哨兵机制:主库挂了,如何不间断服务?

    无论是写服务中断,还是从库无法进行数据同步,都是不能接受的。所以,如果主库挂了,我们就需要运行一个新主库

    2020 年 8 月 19 日

  • 软件架构伸缩性的六大原则

    Pornhub 2019 年访问量超 420 亿,互联网海量规模的网站架构背后,需要怎样的可伸缩性?

    2020 年 8 月 19 日

  • AWS,做好应对下一场风暴的准备

    我在以前的博文 (AWS – Ready to Weather the Storm) 中说过,我们采取了多方面的预防措施,以帮助确保 AWS 在面对飓风、风暴以及其他自然灾害时保持正常运行。

    2019 年 10 月 18 日