亚马逊云科技通过 ARC 区域切换简化了多区域故障转移

  • 2025-08-16
    北京
  • 本文字数:1133 字

    阅读完需:约 4 分钟

亚马逊云科技最近推出了Amazon Application Recovery Controller(ARC)区域切换,这是一个完全托管的、高可用的功能,使组织能够规划、实践和编排区域切换。

 

以前,管理故障转移需要用户创建并维护复杂的脚本来同步不同亚马逊云科技服务(如计算、数据库和 DNS)之间的任务。随着 ARC 区域切换的引入,这种劳动密集型的流程被一个集中化、高可用的解决方案所取代。正如亚马逊云科技的首席开发者倡导者Sébastien Stormacq所指出的:

 

当你需要将应用程序操作从一个亚马逊云科技区域切换到另一个区域时,它为你提供了一个集中化的解决方案来协调和自动化跨亚马逊云科技服务和账户的恢复任务。

 

ARC 区域切换使用户能够创建详细的恢复计划,包含各种执行块,这些执行块定义了区域切换的步骤。这些步骤包括:

 

  • ARC 路由控制:使用 DNS 健康检查重定向流量。

  • Amazon Aurora 全球数据库:执行数据库故障转移或切换。

  • Amazon EC2、Amazon EKS 和 Amazon ECS 扩展:通过指定的百分比扩展目标区域的计算资源。

  • 自定义操作:使用 AWS Lambda 函数集成自定义恢复步骤。

  • 手动审批:在恢复工作流程中添加检查点,供团队审核。

 

(来源:亚马逊云科技新闻博客文章

 

ARC 区域切换的一个关键特性是它的主动验证,它每 30 分钟检查一次资源配置和 AWS IAM 权限,以确保恢复计划始终有效。它还提供了一个全球仪表板,用于监控整个企业计划的状态。

 

为了成本和可靠性,该服务在用户如何准备备用资源方面提供了灵活性。他们可以配置在恢复期间目标区域中所需的计算能力百分比,从而使它们能够平衡成本与性能需求。

 

社区对这种能力的反应是积极的。一位资深的灾难恢复架构师在 Reddit 的帖子上指出,该服务将“使跨区域 DR 运行手册更加容易了。”LinkedIn 上的一条评论进一步强化了这种观点,该评论描述了该服务的关键创新:“一个完全可编排的、自动化的、持续验证的故障转移服务。ARC 不断检查准备情况,将高风险的手动危机转变为自信的、一键式演练,消除了对故障转移的恐惧。”

 

虽然亚马逊云科技通过 ARC 区域切换引入了一个集成的、托管的解决方案,但谷歌云和微软 Azure 也为多区域故障转移提供了类似的能力。这些提供商提供一套强大的工具,可以配置以实现类似的结果,而不是提供的单一服务。例如,Azure 使用Site Recovery等服务进行编排故障转移,以及Front DoorTraffic Manager进行全局流量路由。同样,谷歌云客户通过结合Cloud DNS、故障转移策略和Global Load Balancers来构建多区域恢复策略,以在中断期间重定向流量。

 

目前,ARC 区域切换在所有商业亚马逊云科技区域中均可用,每个计划每月定价为 70 美元,每个计划最多可以包含 100 个执行块。用户还可以创建父计划来编排多达 25 个子计划。

 

原文链接:

https://www.infoq.com/news/2025/08/aws-arc-region-switch-failover/