使用 Amazon 弹性灾难恢复自动化恢复后操作 存储博客
  • 1

使用Amazon Elastic Disaster Recovery自动化恢复后操作

关键要点

灾难恢复DR和业务连续性计划BCP对于任何组织都是至关重要的。AWS Elastic Disaster Recovery服务允许用户在恢复后自动执行验证和配置步骤。本文提供了如何启用和创建自定义的后启动操作的详细教程,以简化恢复过程。

灾难恢复DR和业务连续性规划BCP是任何组织的关键活动。在DR操作中,当在DR站点恢复工作负载后,必须妥善协调和管理一系列步骤和活动,例如应用程序配置和验证,以确保恢复的工作负载正常运行,并能够处理生产流量。这项工作通常很复杂且易出错。自动化和验证恢复后的程序和活动的能力将大大简化DR规划,提升恢复过程的可预测性。恢复后验证的示例可能包括安装代理或验证实例的配置状态。

AWS Elastic Disaster Recovery是AWS的推荐DR服务,帮助您恢复在支持的Windows和Linux操作系统上运行的所有应用程序和数据库。Elastic Disaster Recovery利用Amazon Elastic Compute Cloud (EC2)和Amazon Elastic Block Store (EBS)在DR事件期间自动恢复应用程序。Elastic Disaster Recovery允许您使用后启动操作框架定义在启动恢复实例后自动运行的操作。后启动操作框架让管理员和操作人员能够自动执行任何恢复方案中需要在实例启动后运行的操作,以帮助验证、测试或配置实例。

在本文中,我们将介绍如何启用后启动操作框架,并创建在DR事件响应中自动运行的自定义后启动操作。通过后启动操作框架,操作人员和管理员可以自动化任何需要在实例启动后执行的操作,以帮助验证、测试或配置该实例作为恢复过程的一部分。

功能概述

后启动操作框架通过自动化手动任务如验证、配置和现代化操作加快恢复过程。通过后启动操作框架,您可以为任何AWS Systems Manager命令或自动化文档创建自定义操作,包括您创建的、与您共享的或Amazon发布的文档。此外,Amazon还提供一套预定义的操作,例如安装Amazon CloudWatch代理或从实例创建Amazon Machine Image (AMI)。

前提条件

如果您想跟随本文的逐步指南,您需要满足以下前提条件:

已安装Elastic Disaster Recovery代理的源机器在目标AWS区域中初始化的Elastic Disaster Recovery服务

请注意,要在已启动的恢复实例上运行后启动操作,包括执行Systems Manager文档,需要某些AWS Identity and Access Management (IAM)角色。这些角色通常是在首次在AWS区域初始化Elastic Disaster Recovery的过程中安装到AWS账户中的。

如果您在2023年9月13日之前在您的账户中初始化了Elastic Disaster Recovery,那么您将没有所需的IAM角色来使用后启动操作。

要安装所需的IAM角色,请导航到Elastic Disaster Recovery控制台,从设置菜单中选择默认后启动操作,然后选择安装后启动IAM角色。

图1:安装后启动IAM角色

在弹出窗口中选择确认。

图2:确认创建后启动IAM角色

操作步骤

一旦满足了前提条件,您就必须激活后启动操作功能。您可以选择默认将其激活适用于所有新添加的源服务器,在后续步骤中将进行详细讲解。或者,您也可以为特定源服务器激活此功能。

激活默认后启动操作添加源服务器创建AWS Systems Manager命令文档创建与命令文档对应的后启动操作,并在步骤2中对此源服务器设置为活动状态执行恢复演练并监控活动后启动操作的完成状态

1 激活默认后启动操作

11 导航到默认后启动操作菜单,然后在后启动操作设置窗格中选择编辑。

图3:编辑默认后启动设置

12 选中后启动操作活动旁边的复选框,然后选择保存。

图4:保存对默认后启动设置所做的更改

激活默认后启动操作后,任何新添加的源服务器将继承所配置的设置。

请注意,启用SSM操作将自动激活,且无法停用。此操作安装用于在启动恢复实例后运行后启动操作的Systems Manager代理。

图5:查看自动激活的启用SSM操作

2 添加源服务器

接下来,选择源服务器菜单。在这里,您可以看到我们添加了一个新的源服务器。有关如何添加源服务器的更多信息,请查看此AWS服务指南。

图6:选择源服务器菜单

21 选择新添加的源服务器,并选择后启动设置选项卡。请注意,我们在默认后启动操作菜单中配置的设置已被源服务器继承。

图7:查看新添加源服务器的后启动操作设置

在这里,我们可以激活AWS发布的操作之一或创建自定义操作。让我们创建一个自定义操作,以执行文件权限、网络连通性和应用程序检查。

3 创建AWS Systems Manager命令文档

31 在恢复区域导航到AWS Systems Manager控制台,然后在共享资源菜单下选择文档。

风驰mobile加速器

32 为此演示,我们创建一个Systems Manager命令文档。选择创建文档,然后选择命令或会话。为文档提供名称:DRFailoverValidation Checks。

在内容窗格中使用YAML格式添加以下内容,然后选择创建文档。

yaml

schemaVersion 22description This document performs sanity tests for our failover into AWSmainSteps action awsrunShellScript name ValidateLinuxConnectivity precondition StringEquals platformType Linux inputs timeoutSeconds 3600 runCommand #!/usr/bin/env bash echo Verifying connectivity to amazonawscom ping c 1 amazonawscom if [ eq 0 ] then echo Connectivity to amazonaws passed else echo Connectivity to amazonaws failed exit 1 fi

    echo Verifying ec2user home folder has drwx permissions    ping c 1 amazonawscom    if [[ ls ld /home/ec2user/ == drwx ]]    then        echo ec2user home folder contains the expected permissions    else        echo ec2user home folder contains the unexpected permissions        echo ls ld /home/ec2user/        exit 1    fi    echo Verifying aws cli is installed    which aws    if [  eq 0 ]    then        echo aws cli is installed    else        echo aws cli is missing        exit 1    fi

4 创建一个后启动操作对应于命令文档,并为步骤2中的源服务器设置为活动状态

接下来,我们创建一个与我们刚才创建的Systems Manager命令文档对应的后启动操作。

41 导航到Elastic Disaster Recovery控制台,并从源服务器菜单中选择前面的源服务器。选择添加操作自操作菜单。

图8:添加新后启动操作

42 为操作命名。在这个示例中,我们使用DRFailoverValidationChecks。

43 保留激活此操作复选框选中,然后选择我们在前一步中创建的Systems Manager文档。选择添加操作。

图9:添加后启动操作窗口

将按设置为激活状态的筛选条件设置为活动,我们现在对该源服务器有两个操作处于活动状态。

图10:按激活状态=活动筛选后启动操作

5 执行恢复演练并监控活动后启动操作的完成状态

让我们执行一次恢复演练,查看后启动操作是如何使用的。

51 选择启动恢复作业,然后选择启动恢复演练。

图11:启动恢复演练

52 选择使用最近的数据时间点。

图12:选择最近的时间点

53 要查看恢复作业的状态,请导航至恢复作业历史菜单。

图13:选择恢复作业历史菜单

54 选择最新的恢复作业。

图14:选择最新的恢复作业

55 查看作业卡,并等待恢复作业达到状态为已完成。

图15:查看恢复作业历史日志

56 一旦恢复作业完成,让我们检查刚刚启动的恢复实例上的后启动操作状态。导航到恢复实例菜单,选择新创建的恢复实例。

使用 Amazon 弹性灾难恢复自动化恢复后操作 存储博客

图16:选择新创建的恢复实例

57 从恢复实例的实例信息中,我们可以查看后启动操作状态第1点的状态。我们还可以看到每个单独操作的运行结果第2点,以及与任何相关的CloudWatch日志的诊断链接第3点。

图17:恢复实例后启动操作菜单

清理

为了避免在执行这些步骤后产生不必要的AWS费用,请删除创建的AWS资源。这包括为本练习创建的任何源服务器或恢复实例。

结论

在本文中,我们介绍了Amazon Elastic Disaster Recovery的后启动操作框架。通过逐步指南,我们涵盖了如何首先启用后启动操作,然后如何使用现有操作或创建您自己的自定义操作。最后,我们演示了恢复过程以及如何监控和查看活动后启动操作的完成状态。

自动化和验证恢复后程序和活动的能力简化了DR规划,并在恢复过程中创造了可预测性。后启动操作框架允许您定义在启动恢复实例后自动运行的操作。通过后启动操作框架,操作人员和管理员能够自动化启动实例后必须运行的任何操作,以帮助验证、测试或配置作为恢复过程的一部分。

感谢您阅读本文。如果您有任何评论或问题,请随时在评论区留言。

标签: AWS Cloud Storage,AWS Elastic Disaster Recovery (DRS),AWS Identity and Access Management (IAM),AWS Systems Manager

Stuart Lupton

Stuart Lupton是AWS的灾难恢复专业解决方案架构师。

Jorge Smulevici

Jorge Smulevici是AWS Elastic Disaster Recovery服务团队的软件开发工程师,致力于加速客户在AWS中的采纳和保护。