写点什么

Google 和 Facebook 披露全球范围宕机原因

  • 2019-03-15
  • 本文字数:676 字

    阅读完需:约 2 分钟

Google 和 Facebook 披露全球范围宕机原因

昨日,Google、Facebook两巨头在同一天相继发生全球大规模宕机,其中 Facebook 的断电时常更是超过 10 小时之久。对于宕机事件,Google 和 Facebook 后续分别公开说明了原因。

Google

Google 此次中断时常持续约 4 个小时,影响了 Gmail, G Suite, YouTube 等产品。


Google 在中断事故分析报告中表示,此次事故是 SRE 超载系统使得 Google 云存储错误率提高导致。


报告中说明,3 月 11 日,Google SRE 被告警内部 blob 服务使用的元数据的存储资源显著增加;为了减少资源使用,3 月 12 日 SRE 进行了配置更改,使系统的关键部分超载以查找 blob 数据的位置,最终导致级联故障。


此次事故中,重大的影响包括:Google 云存储的长尾延迟较高,平均错误率为 4.8%,所有存储桶位置和存储类都受到影响,依赖于云存储的 Google 云平台服务也受到影响;Stackdriver Monitoring 在检索历史时间序列数据时出现了高达 5% 的错误率,最近的时间序列数据可用,警报没有受到影响。App Engine 的 Blobstore API 出现了较高的延迟和错误率,在获取 blob 数据时达到峰值 21%,App Engine 部署出现了高达 90% 的错误,从 App Engine 提供静态文件也会出现错误率提升。


对于因此事件受到影响的服务与应用客户,谷歌“深表歉意”,并表示正在采取措施以提高可用性并防止此类中断再次发生。

Facebook

昨日,不少猜测说 Facebook 宕机事故是由于路由泄露引起的,而 Facebook 官方披露的原因是服务器配置变更引起的。



昨日,由于服务器配置变更,导致很多用户无法访问我们的应用和服务。现在我们已经解决了这个问题,系统已经恢复。对用户造成的不便我们深感歉意,感谢所有人的耐心。


2019-03-15 17:305936
用户头像
张婵 InfoQ 技术编辑

发布了 87 篇内容, 共 56.1 次阅读, 收获喜欢 218 次。

关注

评论

发布
暂无评论
发现更多内容

YashanDB ALTER DATABASE语句

YashanDB

数据库

怎样利用YashanDB的存储过程优化查询性能

数据库砖家

怎样利用YashanDB实现企业数据的自动化管理

数据库砖家

通过YashanDB实现数据集成平台的技术分析

数据库砖家

传帮带 人才梯队建设经验总结(2)

万里无云万里天

人才培养 工厂运维

机器学习数据收集优化技术解析

qife122

机器学习 算法优化

【免费开源】基于 STM32F4 的四轴飞行器设计与实现——从零开始到成功起飞(项目源码打包分享)

申公豹

嵌入式

从京东的新AI计划,看到电商与大模型的新连接

脑极体

AI

AI自我提升的五种技术路径

qife122

人工智能 自动化

怎样通过YashanDB支持实时监控需求

数据库砖家

工业数字化 信息化经验总结(1)

万里无云万里天

数字化转型 信息化 工厂运维

工业管理 团队建设经验总结(1)

万里无云万里天

工业 工厂运维

苹果紧急修复针对Chrome用户的零日漏洞

qife122

零日漏洞 系统更新

运用YashanDB数据库构建智能分析平台的方法

数据库砖家

怎样利用YashanDB的弹性扩展确保服务持续可用

数据库砖家

怎样实现YashanDB的高可用性架构设计?

数据库砖家

C#记录类型与集合的深度解析:从默认行为到自定义比较

qife122

C# 不可变集合

通过YashanDB集成云计算服务提升灵活性

数据库砖家

工业设计 自控设计经验总结(1)

万里无云万里天

设计师 工厂运维 工业设计

怎样进行YashanDB性能监控与优化?

数据库砖家

利用YashanDB构建机器学习模型

数据库砖家

怎样实现YashanDB与其他工具的无缝集成?

数据库砖家

YashanDB ALTER FUNCTION语句

YashanDB

数据库

PromptPilot全模型兼容,数据产品能力上新!

新消费日报

传帮带 人才梯队建设经验总结(1)

万里无云万里天

人才培养 工厂运维

实用AI代理提示工程指南

qife122

机器学习 AI代理

怎样利用YashanDB支持API迈向未来

数据库砖家

怎样通过YashanDB优化服务的响应时间

数据库砖家

读书感悟 石油化工自动控制设计手册(10)

万里无云万里天

读书笔记 工厂运维

通过YashanDB进行API的性能测试

数据库砖家

通过YashanDB支持深度学习模型的训练

数据库砖家

Google 和 Facebook 披露全球范围宕机原因_文化 & 方法_张婵_InfoQ精选文章