Amazon Web Service服务稳定状况受到质疑，9月13日美国东一区服务宕机_亚马逊云科技_Chris Swan_InfoQ精选文章

如何将AI能力与大数据技术结合，助力数据分析治理等工作的效率大幅提升，优化大数据引擎的性能及成本？了解详情 



 写点什么

登录/注册

在 9 月 13 日周五早晨，Amazon Web Service（AWS）在美国东一区的服务再次出现宕机，由于这一地区是整个 Amazon 最大、时间最长久并且业务最繁忙的地区，这次宕机使包括 Heroku、Github 和 CMSWire 在内的一大批主流应用服务中断，还影响到了其它许多 Amazon 的客户。

就在最近这次宕机事件发生数日前，关注云端服务的评论者 Ben Kepes 还撰文写道：“每次AWS 的宕机事件，看起来都是由于东区导致了服务故障。”Kepes 还引用了分析师René Büst 的一段文字，其中将美国东一区的服务描述为“陈旧、廉价并且脆弱的”。

Amazon 目前还没有提供详细的故障报告，但上周五的问题已经基本可以归结为网络故障。在 2011 年 4 月的一次故障也是与网络问题相关，但在 2012 年 12 月和 2012 年 10 月发生的最近两次故障都是由弹性负载均衡（Elastic Load Balancer – ELB）和弹性块存储（Elastic Block Storage - EBS）服务出现问题而导致的。网络与 EBS 的故障危害性尤其巨大，因为它们会导致多个可用性区域（Availability Zone）（本应作为故障边界）产生故障，或者使提供容错能力的更高级别服务（例如 ELB）中断。

一般来说，应用程序的提供者只会使用传统的架构方式，而不会为了云端服务以及它固有的不稳定性进行针对性的设计，许多应用程序都不会考虑在一个或多个地区（region）中使用多个可用性区域。但即使针对这些故障进行专门设计，也不见得一定能避免问题的发生。Netflex 使用的那套被戏称为“猿猴军团”和“混沌猴子”的工具一直被遵为云端设计的典范。他们有意持续不断地为自己的平台产生各种错误，并以此证明整个平台良好的自我修复能力，但有些时候（如平安夜宕机事件）这个平台还是不能提供能够承受来自四面八方的负载的能力，使得某些客户所使用到的服务质量下降。

东一区连续不断的宕机，以及那些本应力挽狂澜的服务（例如ELB）的无所作为，为Amazon 在“基础架构即服务”（Infrastructure as a service）这一市场上的竞争对手带来了机会。Google 近期就为Google 计算引擎发布了它自己的负载均衡服务，并且提供了一份关于设计健壮的系统的良好提议。

查看英文原文： Amazon Web Services Stability and the September 13th US East 1 Outage

评论

发布

暂无评论

面试官：GRE 和 IPsec 隧道有什么区别？

期待！Fedora 36 发布日期和新功能

千万级学生管理系统的考试试卷存储方案

「架构实战营」

OKR怎么写？100个OKR案例模板

如何在敏捷中管理和减少技术负债?

selenium的实现原理

自动化测试自动化测试框架 selenium 3月程序媛福利 3月月更

[银行面试系列]1 进入银行之前必须了解的20个问题

3月程序媛福利 3月月更

Linux小技巧：如何在 Vim 中显示行号？

将本地代码同步到gitee和github中去

Git Commit #Github

docker、k8s 面试总结

聊聊 Pulsar： Pulsar 分布式集群搭建

老周聊架构

云原生 Apache Pulsar 3月月更

什么是元宇宙？为何要关注它？——解码元宇宙

比特币突破4.4万美元！美欧制裁或推动俄罗斯资金转向加密货币

紫光展锐解除楚庆CEO职务，内部员工爆料那些不为人知的内情！

杰哥-IC男奋斗史

芯片行业思考

从理想照进现实，浅谈“算力网络”

详解用OpenCV绘制各类几何图形

华为云开发者联盟

OpenCV 图像处理图像几何图形

从用户输入URL到页面展示，这中间发生了什么？

前端浏览器

Go语言实战之数组的内部实现和基础功能

山河已无恙

Go 语言 3月月更

解密数据仓库LLVM技术神奇之处

华为云开发者联盟

数据仓库 LLVM 算子 GaussDB(DWS) 底层虚拟机

Mybatis的where标签，竟然还有这么多不知道的！

读一篇博客，写一段代码，每天写写Python自然就会了，每日Python第1天

梦想橡皮擦

Python 3月月更

今儿直白的用盖房子为例，给你讲讲Java建造者模式

华为云开发者联盟

Java 设计模式对象建造者模式对象构建模式

关于 CentOS 迁移龙蜥操作系统，这里有一份详细指南，请查收！

OpenAnolis小助手

centos 开源操作系统龙蜥

presto实战读书笔记

如何打造良好的分享氛围

团队管理技术分享

开发电脑用 Windows 还是 Mac

初识工业互联网

工业互联网

遵循Promises/A+规范，深入分析Promise实现细节(基础篇)

JavaScript 前端 Promise 3月月更

当TIME_WAIT状态的TCP正常挥手，收到SYN后…

华为云开发者联盟

TCP syn 报文 TIME_WAIT RST报文

如何做好一场技术分享

团队管理个人成长

NFT商城游戏系统开发技术

薇電13242772558