时隔16年Jeff Barr重返10.23-25 QCon上海站,带你看透AI如何重塑软件开发! 了解详情
写点什么

Google 和 Facebook 披露全球范围宕机原因

  • 2019-03-15
  • 本文字数:676 字

    阅读完需:约 2 分钟

Google 和 Facebook 披露全球范围宕机原因

昨日,Google、Facebook两巨头在同一天相继发生全球大规模宕机,其中 Facebook 的断电时常更是超过 10 小时之久。对于宕机事件,Google 和 Facebook 后续分别公开说明了原因。

Google

Google 此次中断时常持续约 4 个小时,影响了 Gmail, G Suite, YouTube 等产品。


Google 在中断事故分析报告中表示,此次事故是 SRE 超载系统使得 Google 云存储错误率提高导致。


报告中说明,3 月 11 日,Google SRE 被告警内部 blob 服务使用的元数据的存储资源显著增加;为了减少资源使用,3 月 12 日 SRE 进行了配置更改,使系统的关键部分超载以查找 blob 数据的位置,最终导致级联故障。


此次事故中,重大的影响包括:Google 云存储的长尾延迟较高,平均错误率为 4.8%,所有存储桶位置和存储类都受到影响,依赖于云存储的 Google 云平台服务也受到影响;Stackdriver Monitoring 在检索历史时间序列数据时出现了高达 5% 的错误率,最近的时间序列数据可用,警报没有受到影响。App Engine 的 Blobstore API 出现了较高的延迟和错误率,在获取 blob 数据时达到峰值 21%,App Engine 部署出现了高达 90% 的错误,从 App Engine 提供静态文件也会出现错误率提升。


对于因此事件受到影响的服务与应用客户,谷歌“深表歉意”,并表示正在采取措施以提高可用性并防止此类中断再次发生。

Facebook

昨日,不少猜测说 Facebook 宕机事故是由于路由泄露引起的,而 Facebook 官方披露的原因是服务器配置变更引起的。



昨日,由于服务器配置变更,导致很多用户无法访问我们的应用和服务。现在我们已经解决了这个问题,系统已经恢复。对用户造成的不便我们深感歉意,感谢所有人的耐心。


2019-03-15 17:305921
用户头像
张婵 InfoQ 技术编辑

发布了 87 篇内容, 共 55.9 次阅读, 收获喜欢 218 次。

关注

评论

发布
暂无评论
发现更多内容

阿里云 EMR Serverless Spark 在微财机器学习场景下的应用

阿里云大数据AI技术

大数据 数据采集 分布式训练 EMR

音视频互动APP的成本

北京木奇移动技术有限公司

音视频开发 软件外包公司 音视频APP

人工智能丨DeepSeek-V3:推理速度飙升,开源模型新王者诞生!

测试人

人工智能 软件测试

华为Mate 70的麒麟9020芯片是谁生产的?

博文视点Broadview

Volcano v1.11 重磅发布!开启AI与大数据的云原生调度新纪元

华为云原生团队

云计算 开源 容器 云原生

谷歌访问助手(谷歌浏览器插件)Mac版

Rose

探索生成式AI与低代码结合的无限可能

天津汇柏科技有限公司

低代码 生成式AI

综合治理系统(源码+文档+部署+讲解)

深圳亥时科技

提示词工程的十大认知误区

阿里技术

提示词

DeepSeek 爆火全球,昇腾让DeepSeek上线加速

极客天地

音视频互动APP的技术难点

北京木奇移动技术有限公司

音视频开发 软件外包公司 音视频APP

火山引擎数据飞轮2.0助力中信银行,用“AI”开启新年新气象

字节跳动数据平台

Three-Body Technology Lost Soul for mac(三体洞箫软件音源) 激活版

Rose

专业级别的视频编辑软件Adobe Premiere Pro 2025 for Mac中文激活

小玖_苹果Mac软件

高效文件查找工具ProFind for Mac中文激活版

小玖_苹果Mac软件

未来技术路线选择:低代码开发还是传统开发?

秃头小帅oi

2024年最受欢迎的5个Go框架

王中阳Go

后端 go框架

交互式产品原型设计工具 Axure RP 9 mac中文破解版 含永久密钥

Rose

音视频互动APP的开发框架

北京木奇移动技术有限公司

软件外包公司 音视频APP 音视频编解码

【YashanDB知识库】对比Oracle和YashanDB对象不一致的方法

YashanDB

数据库 yashandb

Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践

阿里云大数据AI技术

大数据 阿里云 数据集成 Dataworks FFA

Numa初识

天翼云开发者社区

服务器 构架 NUMA

技术干货|Altair HyperWorks 二次开发与 Python 重构仿真新体验

Altair RapidMiner

Python 重构 开发语言 前处理软件

PlistEdit Pro for Mac(Plist编辑器)v1.9.7直装版

Rose

Type Fu for Mac(打字练习)v4.8.0激活版

Rose

低代码开发中的创新实践

伤感汤姆布利柏

Google 和 Facebook 披露全球范围宕机原因_文化 & 方法_张婵_InfoQ精选文章