写点什么

伊朗冲突致多座 AWS 数据中心受损,多可用区部署假设面临挑战

  • 2026-03-20
    北京
  • 本文字数:1582 字

    阅读完需:约 5 分钟

本月早些时候,伊朗无人机袭击损毁了阿联酋和巴林境内的三座亚马逊云科技(AWS)数据中心,导致多项服务中断、出现故障。这些事件影响了同一 AWS 区域内的多个设施,也引发了业界关于地缘政治冲突如何直接冲击全球云基础设施及多可用区部署方案的讨论。

冲突爆发后不久,多架无人机袭击了中东地区的 AWS 数据中心。3 月 1 日深夜,伊朗无人机袭击了阿联酋和巴林境内的三座 AWS 数据中心,这些数据中心分属不同可用区。AWS 确认

在 ME‑CENTRAL‑1(阿联酋)区域,三个可用区中有两个(mec1‑az2 和 mec1‑az3)仍受损严重。第三个可用区(mec1‑az1)可正常运行,但部分服务因依赖受影响可用区而间接受到波及。在 ME‑SOUTH‑1(巴林)区域,一处设施受到影响。

尽管阿联酋区域仍有一个可用区正常运行,但整个区域仍处于中断状态。原因是依赖跨多个数据中心实现冗余与容量保障的核心功能及数据库已严重受损或性能降级。

AWS 将区域定义为地理区域内至少三个物理隔离的可用区。可用区在设计上彼此保持一定距离,足以确保影响单个可用区的自然灾害不太可能波及其他可用区,同时间距控制在 100 公里以内,以保证区域内数据中心之间的低延迟。尽管 AWS 宣称,采用跨多可用区架构可防范“停电、雷击、龙卷风、地震”等故障,但该模式此前并未在冲突地区接受过实际检验。

业内曾流传一个很流行的说法:只有陨石撞击才能摧毁整个云服务区域。但如今,几架无人机突然成为了更现实的风险,这也引发了关于“许多人误解了单区域部署”的讨论。亚马逊已向客户发送了多份通知,其中也包括在巴林区域存有数据的客户——该区域大部分可用区仍可正常使用,通知中写道:

鉴于当前冲突持续,我们建议数据位于巴林(ME-SOUTH-1)区域的客户将关键数据复制至其他 AWS 区域。尽管 AWS 基础设施具备高弹性,但鉴于当前局势的不确定性,我们建议客户将 S3 数据从 ME-SOUTH-1 区域复制到其他 AWS 区域。

荷兰银行清算银行(ABN AMRO Clearing Bank)发布与部署顾问 Harshwardhan Choudhary 评论道:

这是首次有记录的、针对大型超大规模云服务商数据中心的战时动能打击——这为所有云架构师敲响了警钟……多可用区架构并非灾难恢复方案。它能防范硬件故障,却无法抵御导弹击中同一城市内整个可用区集群的情况。

建议在中东地区运行业务负载的客户立即启动灾难恢复预案,利用存储在其他区域的远程备份恢复系统,并将应用流量从受影响区域迁离。目前,受影响数据中心的全面恢复时间表尚未公布。AWS 表示:

即便我们正全力恢复相关设施,但该地区持续的冲突使得中东整体运营环境仍存在不确定性。我们强烈建议在中东地区运行业务负载的客户立即采取行动,将业务迁移至其他 AWS 区域,并可根据自身延迟与数据驻留需求,选择美国、欧洲或亚太区域的站点。

《企业集成模式》合著者、《软件架构师电梯》作者 Gregor Hohpe 认为,多云并非解决方案:

风险是区域性的,与云服务商无关。能够摧毁 ME‑CENTRAL 的力量同样可以摧毁 Azure 或其他任何服务商的数据中心。因此,应对方案是降低区域层面的暴露风险,而非更换服务商(除非你只想玩“服务商打地鼠”的游戏)……许多企业仍未意识到,云环境需要一套全新的运营模式。他们依旧认为,仅靠采购或基础设施就能实现弹性高可用。

迪拜 Pay10 Global 灾难恢复负责人 Paul Barrett 撰文分析了此次阿联酋 AWS 服务中断对受监管实体的启示。T-Systems International 高级云架构师 Mohamed Radwan 警告称:

数据驻留不仅是最佳实践,更是法律要求。在危机期间将业务负载迁移至其他区域,虽可使服务恢复上线,但会带来敏感数据出境的风险。

MariaDB 等第三方公司已记录了他们从中东区域迁移数据的处理过程。受此次事件影响且需要进一步协助的 AWS 客户,可直接联系 AWS 支持获取帮助。

【声明:本文由 InfoQ 翻译,未经许可禁止转载。】

查看英文原文:https://www.infoq.com/news/2026/03/aws-multiaz-conflict-outage/