9月7日-8日,相约 2023 腾讯全球数字生态大会!聚焦产业未来发展新趋势! 了解详情
写点什么

亚马逊、GitHub、Reddit 等全球性网站无法登陆,带火了一家云计算公司

  • 2021-06-15
  • 本文字数:1801 字

    阅读完需:约 6 分钟

亚马逊、GitHub、Reddit 等全球性网站无法登陆,带火了一家云计算公司

此次事件是由于美国云计算服务商 Fastly 当天发生了技术故障,从而导致大规模网站无法解析。


北京时间 6 月 8 日晚,据外媒报道,包括亚马逊、Reddit、Twitch、GitHub、eBay、Etsy、Pinterest 和 Stack Overflow 在内的多家全球性网站出现故障。其中影响最严重的是美国和欧洲的新闻媒体网站,例如《纽约时报》《卫报》《金融时报》《美国有线电视新闻网》《世界报》《纽约杂志》《纽约客》等。 


图片来源:rt.com


社交媒体方面,除了 Twitter 的表情包无法使用外,社交媒体网站相关功能并未受到影响。但由于受影响的网站平日承载的流量巨大,全球各地的人们开始在社交媒体上热议此事,都想知道究竟发生了什么。


事发原因找到了,系云服务商 Fastly 出故障


从社交媒体的反应来看,包括美国、英国、澳大利亚等来自世界各地的人们都报告了网站服务中断的消息,表明这是一个全球性的事件。


据彭博社消息,此次事件是由于美国云计算服务商 Fastly 当天发生了技术故障,从而引发的大规模网站无法解析问题。


Fastly 是美国一家基础设施软件和服务提供商,其主要业务是为企业提供内容分发服务,帮助终端用户并更加快速地获取、访问内容。


当天 9 时 58 分开始,Fastly 网站即进入问题诊断状态,其后多次更新时间状态。到 12 时 41 分,最新消息显示其已解决此问题,随着全球服务的回归,客户会遇到一段时间的负载增加,也就意味着网页(初次)加载缓慢。可以看到,从网站进入问题诊断状态到最终宣布问题解决,Fastly 花了接近 3 小时。 


图片来源:nbd.com


当前,受影响的英美媒体网站以及 Amazon、Reddit 等网站已经陆续恢复正常服务,Twitter 表情包也已经能够正常使用。而对于此事件,暂未有媒体报道黑客攻击的相关消息。


云厂商宕机常有,4 个 9 的安全性是否靠谱?


云厂商宕机故障,这些年一直不是什么新闻。


2019 年,3 月 2 日,阿里云疑似出现大规模故障情况,华北众多互联网公司发现服务器异常。当天晚些时候,阿里云回应称:华北 2 地域可用区 C 部分 ECS 实例状态异常,导致该区域众多网站和 APP 都无法正常使用。


2018 年 6 月 27 日,阿里云也曾出现重大技术故障,当天 16:50 分开始陆续恢复,官方给出的故障时间为 30 分钟左右,恢复时间大概花费一小时。经过技术复盘,阿里给出的故障原因为工程师团队上线自动化运维新功能时,执行了一项变更验证操作,该操作在测试环境中未发生问题,上线后触发未知 bug。


2017 年 2 月 28 日,云计算巨头 AWS S3 故障,事件的起因是 AWS S3(云存储)团队在进行调试时输入了一条错误指令,本应该将少部分的 S3 计费流程服务器移除,可是最终意外移除了大量服务器。被错误移除的服务其中运行着两套 S3 的子系统,从而导致 S3 不能正常工作,S3 API 处于不可用状态。


2017 年 3 月 22 日,微软云服务又一次出现宕机。Outlook、 Hotmail、 OneDrive、 Skype 和 Xbox Live 都出现了网络故障,全球用户都无法登录。


根据笔者统计,仅去年一年,全球主流云计算厂商就曾发生数十起宕机事故,众多安全事故频发,云厂商承诺的 99.99% 的安全可靠性是如何定义的?


熟悉云计算的读者都知道,业界常用 3 个 9、4 个 9,来计算每年的服务故障时间。头部互联网公司对他们的关键服务,通常提出的承诺是 4 个 9,也就是每年最多故障 53 分钟。


不久前,笔者曾就云服务的可靠性一事询问相关技术专家的看法,他表示,云计算厂商得出 99.99% 可靠性这一数字是经过验证的,通过客户部署反馈,确实故障率在 0.01% 以下。并且,一旦出现故障,云厂商也都有非常完善的容灾方案,目前主流云厂商已经在提供一定程度上的异构灾备能力,用户也可以自己搭建跨 DC 方案,技术上能够满足异构容灾需求。


如果客户追求极致容灾能力,有可能建设混合云或者采购多家云厂商,这就会带来很大的成本压力,但这种选择应该比较少,就好比对安全可靠性要求极高的金融数据库领域,也很少有客户同时选择两种数据库方案。


由此可以看出,对于安全性的衡量,不论是 3 个 9 还是 4 个 9 的安全性承诺,其实都需要云服务商的客户有一定的宕机容忍度。而且在具体出问题时,修复时间的长短还得就事论事。也就是说,云服务商承诺的安全性只是一个经过测试认证的达标值,并不是每次服务的水平下限。


但其实,相比上云,如今众多企业自己拥有服务器的成本会更高,并且安全性不如云服务商提供的服务来的优质。因此,对很多企业来说,上云与否已经不再是问题,而是如何选择更适合自身的云上服务 / 解决方案。

活动推荐:

2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。

2021-06-15 16:144202
用户头像

发布了 74 篇内容, 共 24.6 次阅读, 收获喜欢 83 次。

关注

评论

发布
暂无评论
发现更多内容

NFT卡牌挖矿链游dapp系统开发

开发微hkkf5566

值得关注的5款低代码开发平台推荐!

优秀

低代码开发平台 低代码平台

没想到!我在简历上写了“精通MySQL”,阿里面试官跟我死磕后就给我发了高薪offer

程序知音

Java MySQL 数据库 后端技术

java开发技术培训费用是多少

小谷哥

Dell UltraSharp 27显示器,创造你想要的“视”界

科技热闻

技术分享| 消息队列Kafka群集部署

anyRTC开发者

nginx kafka zookeeper 分布式 消息

Confidential Containers:云原生机密计算基础设施

OpenAnolis小助手

开源 cncf 龙蜥 机密计算 沙箱

vue3实战-完全掌握ref、reactive

yyds2026

Vue

SAP | 认识数据元素和域

暮春零贰

SAP abap 10月月更

SAP | 详解abap数据类型

暮春零贰

SAP abap 10月月更

【CSPO认证】11月19-20日在线周末班 | 全国招生

ShineScrum捷行

Scrum 敏捷 产品负责人 CSPO 产品经理培训

小程序助力本地生活服务

Geek_99967b

小程序

研发分享 | StoneDB 如何给 Tianmu 引擎增加 delete 功能 #1 调研之旅

StoneDB

数据库 HTAP StoneDB 10月月更 企业号十月PK榜

TiKV 源码阅读三部曲(一)重要模块

PingCAP

TiKV 源码解读

CTO技术共享整理九个shell脚本

CTO技术共享

个人成长 DDoS 10月月更

3M互助公排dapp系统开发智能合约定制

开发微hkkf5566

vue实战-深入响应式数据原理

yyds2026

Vue

Wallys//routerboard,QCN9074,QUECTEL,RM500Q-GL,WiFi6ECard,802.11ax,IPQ6010,IPQ6000,IPQ6018

wallys-wifi6

IPQ6010 ipq6018 IPQ6000

什么是无代码?企业为什么要用无代码进行数字化转型?

优秀

数字化转型 无代码

微服务——想说爱你不容易

为自己带盐

个人感想

渲染行业的未来发展趋势

Finovy Cloud

渲染 云渲染 本地渲染

ThreadLocal 源码分析

zarmnosaj

10月月更

小程序引擎让app获得了什么样的能力

Geek_99967b

小程序

前端开发的程序员还有前途吗

小谷哥

Vue.nextTick核心原理

yyds2026

Vue

zookeeper实现分布式锁

zarmnosaj

10月月更

CTO技术共享整理出来的十个Python自动化脚本

CTO技术共享

Python 个人成长 10月月更

vue中的几个高级概念

yyds2026

Vue

大数据开发培训学习哪家机构好

小谷哥

极客时间运维进阶训练营第一周作业

好吃不贵

遇到消息队列选型肿么办

CTO技术共享

个人成长 消息队列 10月月更

  • 扫码添加小助手
    领取最新资料包
亚马逊、GitHub、Reddit 等全球性网站无法登陆,带火了一家云计算公司_服务革新_施尧_InfoQ精选文章