写点什么

Google 和 Facebook 披露全球范围宕机原因

  • 2019-03-15
  • 本文字数:676 字

    阅读完需:约 2 分钟

Google 和 Facebook 披露全球范围宕机原因

昨日,Google、Facebook两巨头在同一天相继发生全球大规模宕机,其中 Facebook 的断电时常更是超过 10 小时之久。对于宕机事件,Google 和 Facebook 后续分别公开说明了原因。

Google

Google 此次中断时常持续约 4 个小时,影响了 Gmail, G Suite, YouTube 等产品。


Google 在中断事故分析报告中表示,此次事故是 SRE 超载系统使得 Google 云存储错误率提高导致。


报告中说明,3 月 11 日,Google SRE 被告警内部 blob 服务使用的元数据的存储资源显著增加;为了减少资源使用,3 月 12 日 SRE 进行了配置更改,使系统的关键部分超载以查找 blob 数据的位置,最终导致级联故障。


此次事故中,重大的影响包括:Google 云存储的长尾延迟较高,平均错误率为 4.8%,所有存储桶位置和存储类都受到影响,依赖于云存储的 Google 云平台服务也受到影响;Stackdriver Monitoring 在检索历史时间序列数据时出现了高达 5% 的错误率,最近的时间序列数据可用,警报没有受到影响。App Engine 的 Blobstore API 出现了较高的延迟和错误率,在获取 blob 数据时达到峰值 21%,App Engine 部署出现了高达 90% 的错误,从 App Engine 提供静态文件也会出现错误率提升。


对于因此事件受到影响的服务与应用客户,谷歌“深表歉意”,并表示正在采取措施以提高可用性并防止此类中断再次发生。

Facebook

昨日,不少猜测说 Facebook 宕机事故是由于路由泄露引起的,而 Facebook 官方披露的原因是服务器配置变更引起的。



昨日,由于服务器配置变更,导致很多用户无法访问我们的应用和服务。现在我们已经解决了这个问题,系统已经恢复。对用户造成的不便我们深感歉意,感谢所有人的耐心。


2019-03-15 17:305951
用户头像
张婵 InfoQ 技术编辑

发布了 87 篇内容, 共 56.3 次阅读, 收获喜欢 218 次。

关注

评论

发布
暂无评论
发现更多内容

数字化转型须遵循“战略五原则”和“3-1-1战术”

李洋

数字化转型 信创 战略思考 企业数字化 战略技术

一个jvm线程占用多少操作系统内存

hasWhere

django-task1 笔记之python基础

橙橙橙橙汁丶

django #python

MySQL基础之十四:事务

打工人!

MySQL 6月日更

Tomcat架构的认知

邱学喆

tomcat @WebServlet @WebFilter Manager

servlet工作原理之tomcat篇

hasWhere

源码级别理解 Redis 持久化

蘑菇睡不着

Java redis Redis 协议

Zookeeper在线迁移

阿骆麦迪

zookeeper 分布式 中间件 6月日更

区块链场景化应用大有可为

CECBC

5分钟速读之Rust权威指南(二十三)Cargo

wzx

rust

form-data和x-www-form-urlencoded

hasWhere

【21-9】文件和文件夹

耳东@Erdong

PowerShell 6月日更

全国首个“区块链+数字人民币”应用场景在雄安新区落地

CECBC

CSS实战 | 磁性页头和页脚的表格制作

devpoint

CSS 6月日更

一体化、标准化、可视化数据平台,博睿数据领跑智能运维新典范

博睿数据

博睿数据 数据链DNA dataview

ios webRTC实现屏幕共享功能

侠客行

ios WebRTC iOS屏幕共享 replaykit

DeFi从入门到精通

hasWhere

相比买买买,我们更想在618聊一聊云厂商的能力象限价值几何

脑极体

「SQL数据分析系列」5. 多表查询

Databri_AI

数据库 sql 查询语句

互联网推送服务原理

hasWhere

Kubernetes手记(13)- 用户认证系统

雪雷

k8s 6月日更

Java中的关键字final

架构精进之路

Java 6月日更

数据库索引为什么使用B+树

hasWhere

沟通的方法:反向叙述

石云升

读书笔记 沟通 6月日更

科普 DeFi 中的闪电贷

hasWhere

从金融街往事到全场景智慧金融未来

脑极体

《原则》(十六)

Changing Lin

6月日更

内推学弟进了腾讯,看看他的标杆简历!

程序员鱼皮

Java 后端 简历 校招 秋招

戏说前端 JavaScript 之『防抖节流』基础知识

编程三昧

JavaScript 大前端 防抖节流 函数节流 函数防抖

期权的初步认识

Qien Z.

期权 6月日更

让区块链价值的属性之一“免信任”,更好的融入

CECBC

Google 和 Facebook 披露全球范围宕机原因_文化 & 方法_张婵_InfoQ精选文章