写点什么

Cloudflare 全球停机追踪到内部数据库更改

作者:Steef-Jan Wiggers

  • 2025-11-27
    北京
  • 本文字数:1371 字

    阅读完需:约 4 分钟

大小:666.08K时长:03:47
Cloudflare全球停机追踪到内部数据库更改

Cloudflare 最近经历了一次由数据库权限更新引起的全球中断,在其 CDN 和安全服务中引发了广泛的 5xx 错误。

 

中断开始于 11 月 18 日 11 点 20 分左右,阻塞了客户站点的访问,甚至 Cloudflare 自己的团队也无法访问他们的内部仪表板。根据首席执行官 Matthew Prince 发布的事后分析,根本原因是在对ClickHouse数据库集群进行例行改进时出现了细微的退化。

 

工程师们推出了一项旨在通过让用户显式访问表来提高安全性的更改。然而,这个更新对Bot管理系统产生了糟糕的、意料之外的副作用。一个元数据查询,一个历史上返回默认数据库中列的干净列表的元数据查询突然开始从底层 r0 数据库分片中拉取重复行。

 

Prince 在博客文章中解释了技术细节

 

这个变更...导致所有用户都能访问到他们有权访问的表的准确元数据。不幸的是,过去的假设认为,像这样的查询返回的列列表只包括“默认”数据库。

 

这些额外的数据导致“特性文件”(一个用于跟踪机器人威胁的配置集)的大小增加了一倍。Cloudflare 的核心代理软件为这个文件预分配内存以优化性能,但它有一个硬性安全限制,即 200 个特性。当膨胀的文件进入网络时,它突破了这个限制,导致 Bot 管理模块崩溃。

 


(来源:Cloudflare博客文章)

 

由于其表现,这次事件很难诊断。由于数据库更新是逐步推出的,系统每几分钟就在“好”状态和“坏”状态之间切换。这种不稳定的行为最初让工程团队相信他们正在对抗一场超大规模的 DDoS 攻击,而不是内部错误。当 Cloudflare 的外部状态页面也崩溃时,混乱达到了顶峰,这是一个完全的巧合,导致一些人认为支持基础设施正在被攻击。

 

Reddit 上的一个评论者在讨论中评论道:

 

你不会意识到有多少网站使用 Cloudflare,直到 Cloudflare 停止工作。然后你尝试查找有多少网站使用 Cloudflare,但你不能,因为所有会回答你问题的 Google 结果也在使用 Cloudflare。

 

“我们的网络有一段时间无法路由流量,这对我们团队的每个成员来说都是非常痛苦的,”Prince 写道,他指出这是自 2019 年以来公司最严重的服务中断。

 

当用户努力应对服务中断时,Syber Couture 的 CEO Dicky Wong 将这一事件视为多供应商策略的验证。他回应这一事件时评论说,尽管 Cloudflare 提供了一套出色的工具,“爱情与没有婚前协议的婚姻不同。”Wong 认为,风险管理需要向积极的多混合策略转变,以避免定义这次服务中断的“单点物理故障”。

 

r/webdev subreddit上的用户 crazyrebel123 也表达了这种情绪,他指出了当前互联网格局的脆弱性:

 

如今的问题是,只有少数几家大公司运营或拥有互联网上的大部分内容。所以当其中一个坏了,整个互联网都会坏掉。大多数网站现在都运行在 AWS 或其他形式的云服务上。

 

高级技术领袖 Jonathan B.在LinkedIn上加强了这一观点,他批评了组织倾向于为了“简单”而将所有赌注押在单一供应商上。

 

这很简单,是的——直到那个供应商成为每个人都在推特上谈论的服务中断...人们称混合型为“老派”,但说实话?这只是负责任的工程。这是承认服务中断会发生,无论云的侧面标志有多大。

 

最终,通过手动将配置文件的已知正确版本推入分发队列,服务得以恢复。流量在 14:30 UTC 时恢复正常,事件在下午晚些时候完全解决。Cloudflare 表示,它现在正在审查其所有代理模块的故障模式,以确保内存预分配限制在未来更优雅地处理不良输入。

 

原文链接:

https://www.infoq.com/news/2025/11/cloudflare-global-outage-cause/

2025-11-27 09:402496

评论

发布
暂无评论

OSXBytes Lock-It for Mac(应用程序加密工具)

春天的风暖暖的

Swinsian for Mac(音乐播放器)

春天的风暖暖的

Photo Image Editor Pixelstyle for Mac(图像编辑器)

春天的风暖暖的

企业选择YashanDB的核心考量因素解析

数据库砖家

YT Saver for Mac(视频下载和转换器)

春天的风暖暖的

LunarBar for mac(菜单栏极简日历工具)

春天的风暖暖的

在AI技术唾手可得的时代,挖掘新需求成为核心竞争力——某知名AI开发框架需求洞察

qife122

开源框架 AI开发

MediaInfo for mac(媒体信息检测软件)

春天的风暖暖的

Affinity Designer for Mac(强大的矢量图设计软件)

春天的风暖暖的

ForkLift for Mac(文件管理程序)

春天的风暖暖的

Acorn for Mac(mac图像处理软件)

春天的风暖暖的

用AirPods控制的创新iPhone游戏:RidePods技术解析

qife122

ios开发 空间音频

DVD-Cloner XR for mac(DVD复制刻录)

春天的风暖暖的

Graphic Inspector for mac(mac图像检查器)

春天的风暖暖的

Duplicate Photos Fixer Pro for Mac(重复照片清理软件)

春天的风暖暖的

OpenAI炸场!Sora 2正式发布,它不只是个视频模型,更是一个社交宇宙!

hepingfly【gzh:和平本记】

AI sora

两种不同的并行

Miracle

在AI技术唾手可得的时代,挖掘用户真实需求成为产品成功的关键——某知名设备电量监控工具需求探索

qife122

功能优化 产品需求分析

Tinderbox 11 for Mac(mac笔记工具)

春天的风暖暖的

[大厂实践] CPU 性能拆解:利用率如何影响性能

俞凡

架构

Cisdem Video Converter for Mac(视频格式转换器)

春天的风暖暖的

Mac Mouse Fix for Mac mac鼠标平滑滚动工具

春天的风暖暖的

Bartender 6 for mac(菜单栏图标管理软件)

春天的风暖暖的

FotoMagico for Mac(专业幻灯片制作软件)

春天的风暖暖的

FxFactory 8 Pro for Mac(视觉特效处理包)

春天的风暖暖的

DxO PhotoLab 9 ELITE Edition for mac(全新的RAW照片编辑器)

春天的风暖暖的

Topaz Photo Pro for Mac(智能图像增强软件)

春天的风暖暖的

Mac电脑清理工具:OSXBytes Remove-It for Mac

春天的风暖暖的

Algoriddim djay Pro Ai for Mac(DJ混音软件)

春天的风暖暖的

Squeezer for Mac(图片压缩优化工具)

春天的风暖暖的

Processing:创意编程与可视化的强大工具

程序员架构进阶

可视化 数据可视化 10月月更 Processing

Cloudflare全球停机追踪到内部数据库更改_云计算_InfoQ精选文章