写点什么

因网络配置错误,Cloudflare 发生 27 分钟中断

  • 2020-09-07
  • 本文字数:932 字

    阅读完需:约 3 分钟

因网络配置错误,Cloudflare发生27分钟中断

Cloudflare是一家从事 Web 性能和可靠性保证的公司,最近,它的网络性能和服务出现了部分中断,持续了 27 分钟。Cloudflare 主干网中的一个错误导致了这次中断,导致整个网络的流量下降了 50%。CloudFlare CTO John Graham-Cumming 在博文中澄清,这次中断不是由任何类型的攻击或破坏引起的。


Graham-Cumming 表示,公司的网络工程团队更新了一个路由器配置,以便减少网络拥塞,解决一个不相关的问题。问题出在主干网从纽瓦克到芝加哥之间的一个分段上。配置上的错误导致所有的通信通过主干网被发送到亚特兰大路由器,给路由器造成巨大的负载。


这导致连接到亚特兰大的 Cloudflare 网络位置不可用。受影响的 20 个地点分别是圣何塞、达拉斯、西雅图、洛杉矶、芝加哥、华盛顿特区、里士满、纽瓦克、亚特兰大、伦敦、阿姆斯特丹、法兰克福、巴黎、斯德哥尔摩、莫斯科、圣彼得堡、圣保罗、库里提巴和阿雷格里港。


Twitter 用户开始报告服务出现故障,League of Legends、Deliveroo、Discord、Feedly、GitLab、Medium、Patreon、Politico 和 Shopify 等网站都受到了影响。


Graham-Cumming 向大家道歉,并对主干网的配置做了一个全面的修改,以防止这种中断再次发生。Cloudflare 首席执行官 Matthew Prince 进一步透露了细节,他在推特上写道:“根本原因是主干网上的路由器配置错误。我们已经采取了防护措施,以确保在未来类似的错误在不会造成问题。”


网络论坛上既有支持的也有表示怀疑的。在 Reddit 上,一位名叫 rotarychainsaw 的用户对容易犯的小错误(比如输入错误)表示同情,“我的意思是……谁以前没有犯过这样的错误呢?”其他几个评论者在同一个帖子对审核过程提出了质疑,hennirl 问道:“我很好奇这个变更是如何通过变更审核的。他们肯定有不同的配置变化,至少有两波人在看吧?……”。


2019 年 7 月 2 日也发生了一次类似的中断,当时 Cloudflare 网站抛出了 502 错误,原因是 CPU 利用率大幅上升。Jerome Fleury 在推特上敦促用户提出(“困难的”)问题,他说宕机让他们学到了“很多教训”。


有兴趣的读者可以在 InfoQ 与 Ryan kitchen 的相关播客以及Learning from Incidents博客中看到更多关于后期剖析、“根源”问题、克服学习障碍等话题。


原文链接


Cloudflare’s 27 Minutes Outage Explained


2020-09-07 17:142545

评论

发布
暂无评论
发现更多内容

架构实战营 - 模块01作业

架构实战营

服务器如何修复旧加密算法漏洞

运维研习社

4月日更 服务器安全

坚持到底有多难?

小天同学

坚持 自我思考 个人感悟 成长与思考 4月日更

架构实战营 模块一课后作业

iProcess

架构实战营

带你厘清事务一致性(上篇)

小舰

4月日更

你才不是只会理论的女同学-seata实践篇

好好学习,天天向上

Java MySQL spring 事务 seata

模块一

yu

架构实战营

GitHub 如何修改默认的分支

HoneyMoose

Linux find 命令

一个大红包

4月日更

洞察细节深究业务—数据分析的进阶

小飞象@木木自由

数据分析 数据分析体系 理解业务 数据分析进阶

模块一

^_^vincent

架构实战营 模块一作业

fazinter

架构实战营 作业一

「开源免费」基于Vue和Quasar的前端SPA项目crudapi后台管理系统实战之用户登录(二)

crudapi

Vue Cookie crud crudapi quasar

架构实战营模块1作业

贯通

架构实战营

斩获三项大奖!浪潮云精彩亮相数字化转型发展高峰论坛

云计算

[架构实战营][0期]模块1学习总结

张民

架构实战营

80%的人都不会的,15个Linux实用技巧

鞋子特大号

Linux

课程1作业

husx

架构实战营 模块1 课后作业

张伟明

Python OpenCV 修改一寸照片底色,图像处理取经之旅第 20 天

梦想橡皮擦

Python OpenCV 4月日更

ES9的新特性:正则表达式RegExp

程序那些事

正则表达式 ecmascript 程序那些事 es9

Dubbo源码阅读-泛化调用实现原理

小江

dubbo RPC

模块一作业

Geek_cb6852

架构实战营

架构实战营第一模块作业

DZ

提升漏洞修复率,DevSecOps真的很有一套

华为云开发者联盟

软件 安全 DevSecOps 漏洞修复 软件漏洞

架构实战营模块1作业

CR

架构实战营模块1作业

cclouds

架构实战营 模块1

Acker飏

架构实战营 - 模块 1- 作业

carl

架构实战营

架构实战营模块1作业

梦寻解语花

架构实战营

#架构实战营 模块一作业

薛定谔的指南针

架构实战营

因网络配置错误,Cloudflare发生27分钟中断_服务革新_Aditya Kulkarni_InfoQ精选文章