写点什么

因网络配置错误,Cloudflare 发生 27 分钟中断

  • 2020-09-07
  • 本文字数:932 字

    阅读完需:约 3 分钟

因网络配置错误,Cloudflare发生27分钟中断

Cloudflare是一家从事 Web 性能和可靠性保证的公司,最近,它的网络性能和服务出现了部分中断,持续了 27 分钟。Cloudflare 主干网中的一个错误导致了这次中断,导致整个网络的流量下降了 50%。CloudFlare CTO John Graham-Cumming 在博文中澄清,这次中断不是由任何类型的攻击或破坏引起的。


Graham-Cumming 表示,公司的网络工程团队更新了一个路由器配置,以便减少网络拥塞,解决一个不相关的问题。问题出在主干网从纽瓦克到芝加哥之间的一个分段上。配置上的错误导致所有的通信通过主干网被发送到亚特兰大路由器,给路由器造成巨大的负载。


这导致连接到亚特兰大的 Cloudflare 网络位置不可用。受影响的 20 个地点分别是圣何塞、达拉斯、西雅图、洛杉矶、芝加哥、华盛顿特区、里士满、纽瓦克、亚特兰大、伦敦、阿姆斯特丹、法兰克福、巴黎、斯德哥尔摩、莫斯科、圣彼得堡、圣保罗、库里提巴和阿雷格里港。


Twitter 用户开始报告服务出现故障,League of Legends、Deliveroo、Discord、Feedly、GitLab、Medium、Patreon、Politico 和 Shopify 等网站都受到了影响。


Graham-Cumming 向大家道歉,并对主干网的配置做了一个全面的修改,以防止这种中断再次发生。Cloudflare 首席执行官 Matthew Prince 进一步透露了细节,他在推特上写道:“根本原因是主干网上的路由器配置错误。我们已经采取了防护措施,以确保在未来类似的错误在不会造成问题。”


网络论坛上既有支持的也有表示怀疑的。在 Reddit 上,一位名叫 rotarychainsaw 的用户对容易犯的小错误(比如输入错误)表示同情,“我的意思是……谁以前没有犯过这样的错误呢?”其他几个评论者在同一个帖子对审核过程提出了质疑,hennirl 问道:“我很好奇这个变更是如何通过变更审核的。他们肯定有不同的配置变化,至少有两波人在看吧?……”。


2019 年 7 月 2 日也发生了一次类似的中断,当时 Cloudflare 网站抛出了 502 错误,原因是 CPU 利用率大幅上升。Jerome Fleury 在推特上敦促用户提出(“困难的”)问题,他说宕机让他们学到了“很多教训”。


有兴趣的读者可以在 InfoQ 与 Ryan kitchen 的相关播客以及Learning from Incidents博客中看到更多关于后期剖析、“根源”问题、克服学习障碍等话题。


原文链接


Cloudflare’s 27 Minutes Outage Explained


2020-09-07 17:142536

评论

发布
暂无评论
发现更多内容

伊克罗德信息连获三重国际认证,以标准化服务体系护航客户数智化转型

伊克罗德信息科技

点量场馆预约小程序解决方案,开启智慧预约新体验!

点量实时云渲染

小程序 微信小程序 App 预约小程序 客户预约管理系统

AI 英语作文 App 的开发

北京木奇移动技术有限公司

AI教育 软件外包公司 AI英语

海外社交媒体分析平台测评指南:2025年主流平台深度横评

沃观Wovision

社交媒体 社媒监测 海外社交媒体监控 社媒分析

AI赋能:新一代海外社交媒体分析软件的智能功能对比

沃观Wovision

社交媒体 社媒监测 海外社交媒体监控 社媒分析

中国电建北京院 ×NineData:构筑能源基建数据管理新范式,为 "数字基建" 夯实数据根基

NineData

数据库 数据管理 数据管理平台 NineData 中国电建

Comate Figma2Code智能体升级,畅享Figma2Code不受限

Comate编码助手

figma 文心快码 编程智能体 Comate AI IDE AI编程助手

Apache SeaTunnel 如何将 CDC 数据流转换为 Append-Only 模式?

白鲸开源

大数据 开源 CDC Apache SeaTunnel Append-Only

企业知识管理革命:AI驱动的新一代知识库如何重塑组织竞争力

百川云开发者

开源知识库

🚀 SightAI 已集成 Google Gemini 3

SightAI

Google 大模型 Gemini API

libcurl FTP路径规范化漏洞解析:编码%2e%2e导致目录穿越

qife122

网络安全 路径遍历

见证中国开源生态成长力量:开源鸿蒙五年跨越与未来展望

最新动态

海外社交媒体分析服务如何助力品牌发现海外增长机会?

沃观Wovision

社交媒体 社媒监测 海外社交媒体监控 社交媒体监测 社媒分析

大厂严选 | 数据堂2025年度版权数据集热销榜单重磅发布!

数据堂

人工智能 人脸识别 数据集 语音识别 大模型

2025数据资产管理平台权威排行榜:智能合规引领行业新生态

科技经济

AI 客服系统:用智能对话让服务“接得快、答得准、体验好”

上海拔俗

AI 英语陪练 App的开发

北京木奇移动技术有限公司

AI教育 软件外包公司 AI英语

2025国内主流低代码平台排行,11月最新盘点,头部厂商全解析

优秀

低代码

工业4.0:AI质检的关键应用和价值

万界星空科技

QMS 产品质量管理 AI质检 AI工业质检 万界星空科技QMS

10大海外社媒分析系统对比:谁才是2025年的性价比之王?

沃观Wovision

社交媒体 社媒监测 海外社交媒体监控 社媒分析

双点击账户接管漏洞深度分析

qife122

网络安全 移动安全

面向复杂生产场景的 Token 双流:百度百舸开源贡献至 SGLang 社区

Baidu AICLOUD

双流 Qwen DeepSeek 推理加速

京东外卖App独立上线,超级App如何集成海量小程序?

FinClip

Dapp区块链商城开发时间费用以及功能、和传统商城有什么区别

西安链酷科技

区块链 Web3 项目开发方法论

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

破解行业绿电直供痛点:西格电力直连架构适配关键技术解析

西格电力

绿色能源转型 绿电直连 能源低碳 低碳经济 绿色能源与可持续发展

大数据-157 Apache Kylin 全面指南:MOLAP 架构、Hive/Kafka 实战与实时 OLAP 落地

武子康

Java 大数据 kylin 分布式 Apache Kylin

Gemini3 强势来袭,这次前端真的死了。。。

苍何

结项报告完整版 | 为 Apache DolphinScheduler 添加 gRPC 插件

白鲸开源

大数据 开源 Apache DolphinScheduler 开源之夏

国外社交媒体分析服务如何助力海外品牌预判国外市场趋势

沃观Wovision

社交媒体 社媒监测 海外社交媒体监控 社媒分析

虚拟电厂VS传统电厂VS微电网的差异:3大维度拆解,避免概念混淆

西格电力

绿色能源 绿色能源转型 虚拟电厂 低碳经济 虚拟电厂系统

因网络配置错误,Cloudflare发生27分钟中断_服务革新_Aditya Kulkarni_InfoQ精选文章