2019 年 InfoQ 最受欢迎的文章排行榜 | 运维篇

2019年InfoQ最受欢迎的文章排行榜来了!

阅读数:1 2020 年 1 月 10 日 17:59

2019年InfoQ最受欢迎的文章排行榜 | 运维篇

2019 年 InfoQ 最受欢迎的文章排行榜来了!

本次榜单涵盖十大热门领域:架构、前端、编程语言、云计算、AI、开源、技术管理、运维、区块链、产业互联网…

第一篇架构篇、第二篇前端篇、第三篇编程语言篇、第四篇云计算篇、第五篇 AI 、第六篇开源、第七篇技术管理已发布。今天,我们来看看“运维”。

2019 年,InfoQ 一共发布了 500+ 篇运维类的文章,总阅读量超过 240 万。

以下是前十篇最受欢迎的运维类文章,你绝对不能错过!

TOP1:《摆脱无效报警?十年运维监控报警优化经验总结》
作者:焦振清
策划:田晓旭

运维工程师面试者第一个问题是:需要值班吗?笔者自己也曾经历过月入十万的时期,在那个时候,数个系统同时发布下一代版本,而老系统还需要过渡很长时间,工作量直接翻倍,大家只能勉强应付一线运维工作,团队成员开始陆续离职,而新人又无法在短时间内上手,整体情况不断恶化,持续半年左右才缓过劲来。

TOP2:《软件交付的演进历程》
作者:Rory Madden
译者:方彦
策划:Tina

经常有人会问我什么是敏捷流程。我都会给出那个让人不尽满意的答案“没有一个单独的流程。它取决于每个团队的实际情况”。为了更好的回答这个问题,我撰写该文介绍了软件交付的演进历史。我打算归纳成一个线性的发展,即使我知道它并不像我要表达的那样有序和线性。但我觉得参考它,能得到比前面那个“取决于”的答案更多的信息。希望它对你同样有用。

TOP3:《混沌工程落地的六个阶段》
作者:焦振清
译者:杜宾
策划:田晓旭

从笔者所在团队的实践出发,我们将混沌工程总结为六个阶段,并对各个阶段的落地过程加以总结,希望能够对大家落地混沌工程有所帮助。今天主要是抛砖引玉,后续针对每个阶段,陆续会有专门的文章进行介绍。而混沌工程理论相关的部分,大家可以参考由 Netflix 出版的《混沌工程》迷你书。

TOP4:《如何从零开始搭建 CI/CD 流水线》
作者:Saurabh Kulshrestha
译者:徐进

在当前 DevOps 的趋势下,持续集成(CI)和持续部署(CD)具有支柱性地位,那么能够成功搭建 CI/CD 流水线就至关重要了。我们可能会在各种角色的岗位描述中发现关于「持续集成」和「持续部署」技能的要求,比如:数据工程师、云解决方案架构师、数据科学家等。为了在开发团队和运营团队之间搭建桥梁,CI/CD 流水线实现了应用程序的自动构建、自动测试和自动部署。本文中,我们将介绍什么是 CI/CD 流水线,以及它是如何工作的。

TOP5:《Puppet:维护运行环境一致性的利器》
作者:焦振清

每次我提到配置管理工具,有些同学就会问类似的问题:容器化时代和 Serverless 时代,还需要配置管理工具吗?我们先不去讨论容器化之后是否需要配置管理工具,那什么时候容器能够在全球范围达到 100% 的普及?什么时候 AWS 仅提供容器而不再提供虚拟机呢?之所以会有如上的问题,根源还在于配置管理工具的定位,到底要解决什么问题?

TOP6:《阿里云 Redis 开发规范》
作者:付磊

本文介绍了在使用阿里云 Redis 的开发规范,从键值设计、命令使用、客户端使用、相关工具等方面进行说明,通过本文的介绍可以减少使用 Redis 过程带来的问题。

TOP7:《服务变更如何做到高可用?》
作者:焦振清

近期, Cloudflare 在更新 WAF 配置规则时,因其中一个规则包含了正则表达式,导致 Cloudflare 全球机器上的 CPU 峰值使用率达到 100%,在最糟糕的时候,流量下降了 82%,对整个互联网都产生了明显的影响。
因此,变更的定义,不仅仅是狭义的上线新版本代码,也应该包含配置变更,数据变更,操作系统变更,网络变更,基础设施变更等方面。变更是运维人员的主要工作内容,同时也是导致服务故障的主要原因。据 Google SRE 统计,线上 70% 的故障都是由某种变更而触发的。

TOP8:《为了追求速度,我们测试了全球所有的 CDN》
作者:Emir Beganović
译者:姚佳灵

Property Finder Group 拥有多元化客户群,遍布中东和北非(Middle East and North Africa,简称 MENA)的 7 个国家。作为首席软件架构师,我一直在努力寻找新方法来提高客户满意度并优化他们的用户体验,而且往往是性能方面的用户体验。就个人而言,我相信 Kaizen 方法:通过小而积极的改变来创造持续改进,并且随着时间的推移会触发雪球效应。作为在 Property Finder 中应用该流程的一部分,我们希望不断优化性能,降低我们网站上和应用程序中资源的终端用户延迟。

TOP9:《全面解读:支付宝技术风险体系建设历程》
作者:赵钰莹

“很多事情,说出来很多人都在做,但是只有真正做到极致,技术的差异性才会体现出来”,蚂蚁金服技术风险部研究员陈亮(花名:俊义)在接受 InfoQ 采访时如上说道。在最近支付宝技术嘉年华期间,InfoQ 对支付宝数次技术架构升级的见证者及主导架构师陈亮进行了独家采访,首次系统了解稳定支撑“双十一”等多次实战背后的支付宝技术风险体系。

TOP10:《实时监控系统如何帮助 FreeWheel 支持超级赛事直播广告?》
作者:Debra

足球比赛的直播,广告点基本上比较固定,就是中场休息,但是对于像 NBA、NFL 橄榄球比赛,你根本就不可能知道教练什么时候叫暂停,所以也就不知道具体的广告时间。对于我们系统来说,主要有三个特点:高并发、实时响应和高可用。 高并发:直播赛事进广告的时候,几乎是所有用户都同时发起广告请求, 也就是说,所有的广告请求几乎同时要发给广告投放服务器,导致我们系统面临突发的高并发的压力。

评论

发布