PCon全球产品创新大会最新日程一览,这里直达 了解详情
写点什么

Google 和 Facebook 披露全球范围宕机原因

  • 2019 年 3 月 15 日
  • 本文字数:676 字

    阅读完需:约 2 分钟

Google 和 Facebook 披露全球范围宕机原因

昨日,Google、Facebook两巨头在同一天相继发生全球大规模宕机,其中 Facebook 的断电时常更是超过 10 小时之久。对于宕机事件,Google 和 Facebook 后续分别公开说明了原因。


Google

Google 此次中断时常持续约 4 个小时,影响了 Gmail, G Suite, YouTube 等产品。


Google 在中断事故分析报告中表示,此次事故是 SRE 超载系统使得 Google 云存储错误率提高导致。


报告中说明,3 月 11 日,Google SRE 被告警内部 blob 服务使用的元数据的存储资源显著增加;为了减少资源使用,3 月 12 日 SRE 进行了配置更改,使系统的关键部分超载以查找 blob 数据的位置,最终导致级联故障。


此次事故中,重大的影响包括:Google 云存储的长尾延迟较高,平均错误率为 4.8%,所有存储桶位置和存储类都受到影响,依赖于云存储的 Google 云平台服务也受到影响;Stackdriver Monitoring 在检索历史时间序列数据时出现了高达 5% 的错误率,最近的时间序列数据可用,警报没有受到影响。App Engine 的 Blobstore API 出现了较高的延迟和错误率,在获取 blob 数据时达到峰值 21%,App Engine 部署出现了高达 90% 的错误,从 App Engine 提供静态文件也会出现错误率提升。


对于因此事件受到影响的服务与应用客户,谷歌“深表歉意”,并表示正在采取措施以提高可用性并防止此类中断再次发生。


Facebook

昨日,不少猜测说 Facebook 宕机事故是由于路由泄露引起的,而 Facebook 官方披露的原因是服务器配置变更引起的。



昨日,由于服务器配置变更,导致很多用户无法访问我们的应用和服务。现在我们已经解决了这个问题,系统已经恢复。对用户造成的不便我们深感歉意,感谢所有人的耐心。


2019 年 3 月 15 日 17:305223
用户头像
张婵 InfoQ 技术编辑

发布了 87 篇内容, 共 47.0 次阅读, 收获喜欢 216 次。

关注

评论

发布
暂无评论
发现更多内容

详细解读MySQL高性能优化

秋水

MySQL性能优化 内容合集 签约计划第二季

Android C++系列:Linux Socket编程(一)预备知识

轻口味

android 28天写作 12月日更

Linux之pwd命令

入门小站

Linux

【SpringCloud技术专题】「Gateway网关系列」(2)微服务网关服务的Gateway功能配置指南分析

浩宇天尚

api 网关 SpringCloud Gateway netty 12月日更 服务网关

12. 《重学 JAVA》-- 面向对象

杨鹏Geek

Java 25 周年 28天写作 12月日更

TDSQL在核心交易系统领域的联合解决方案

腾讯云数据库

tdsql 国产数据库

使用Git将本地项目添加至Git仓库

Bug终结者

Java 实用工具 gitee git version

架构实战营-毕业总结

李焕之

运营商行业软件开发| 内容合集

鲸品堂

通信 运营商 技术专题合集

在线JSON转GraphQL工具

入门小站

工具

Dubbo 框架学习笔记二

风翱

dubbo 12月日更

十年所学,终成《代码随想录》!

博文视点Broadview

How to construct a Playground Project

Changing Lin

12月日更

架构训练营毕业设计-电商秒杀系统

李焕之

Linux之mkdir命令

入门小站

Linux

讨论:低代码集成OA/ERP/MES系统,或将是企业应用生态的重要一环?

优秀

低代码

京东白条数据架构进化之路:要在数据的不确定性中探索架构的稳定性

SphereEx

数据库 开源 架构 ShardingSphere 京东白条

我还是很怀念谷歌

张老蔫

28天写作

云原生应用管理,像管理手机APP一样管理企业应用

北京好雨科技有限公司

PaaS #Kubernetes# 应用管理

如何使用会声会影标题工具制作弹幕效果

懒得勤快

智慧园区综合管理平台解决方案,智慧平安社区搭建

电微13828808271

前端开发MySQL 数据库之数据引擎

飞不起来的童年

MySQL 前端

如何利用测试自动化,实现 DevOps?

飞算全自动软件工程平台

使用HTML,CSS和Javascript构建响应式导航栏和面包屑菜单

海拥(haiyong.site)

响应式 大前端 28天写作 签约计划第二季 12月日更

架构训练营 week2 学习总结

红莲疾风

「架构实战营」

区块链电子合同应用平台开发,区块链电子合同解决方案

电微13828808271

大数据开发之Spark和Flink的对比(转载)

飞不起来的童年

大数据 flink spark

TDengine入驻Rainbond开源应用商店

北京好雨科技有限公司

时序数据库 #Kubernetes# rainbond

基于SSM+Shiro+Bootstrap实现用户权限管理系统

Bug终结者

Java bootstrap ssm shiro

架构实战营模块六作业

渐行渐远

架构实战营

如何知道页面浏览时长?

神策技术社区

采集 iOS SDK 页面浏览

Google 和 Facebook 披露全球范围宕机原因-InfoQ