考虑到当今商业环境中采用的云计算技术迅速增加,从导致服务中断和停机的灾难中有效恢复的能力变得更加重要。基于云计算的灾难恢复可以确保企业在尽可能短的时间内恢复其数据和服务的正常运行。
什么是云计算灾难恢复?
灾难恢复是指企业为灾难做好准备以及从灾难中恢复的过程。作为企业业务连续性计划的一个组成部分,灾难恢复旨在保护企业的资产。因此,云计算灾难恢复计划是一组程序和措施,以确保企业的业务顺利运行,由云计算提供商提供的专用设施提供支持。
云计算灾难的发生
了解如何为云计算灾难做好准备以及了解这些灾难如何发生非常重要。首先,业务资产可能会以技术故障的形式暴露在云计算灾难中,例如,当电源或网络连接中断时。
其次,在托管企业正在使用的云服务的服务器所在的地区可能会发生风暴、洪水或地震等自然灾害,从而导致服务中断和停机。
云计算灾难可能以人为灾难的形式发生,这比自然灾害更常见,并且可能涉及导致严重服务中断的简单错误。它们经常在使用云服务时发生,不幸的是无法根除。例如,它们可能是由输入错误、简单的配置错误、意外删除或未能执行软件更新而触发——这使得威胁行为者很容易控制云服务。
当威胁行为者通过勒索软件等恶意软件访问云服务时,他们就会对企业的基础设施构成威胁。这些威胁行为者很容易导致服务中断,并为了自己的利益而中断受害者的业务运营。勒索软件是当今云计算数据的一大挑战,这些威胁不断发展的事实使它们变得更加令人生畏。
为云计算灾难做好准备
要为云计算灾难做好准备,企业需要不断测试其数据恢复框架。企业可以进行一些测试:
- 完全中断测试。作为可以执行的最彻底的测试,完全中断测试将会停止运营并复制灾难,以衡量企业如何应对实际灾难。它可能代价高昂,并且在不成功的情况下可能会无意中造成重大中断。
- 演练测试。与完全中断测试相比,这种测试不那么彻底,企业需要审查灾难恢复计划,并提供机会找出差距以改进灾难恢复计划。
- 并行测试。恢复操作在与主要系统不同的网络上执行。
- 模拟测试。模拟灾难以提示团队模拟他们记录的灾难恢复计划。这可以随机进行,以衡量响应者的准备情况和现有策略的有效性。
云计算灾难恢复的重要性
云计算灾难恢复减少了对物理基础设施的依赖。这简化了企业的运营,因为企业将其灾难恢复工作负载外包。此外,企业无需升级或支持其物理基础设施以在远程站点进行灾难恢复。基于云计算的服务提供了额外的优势,例如自动化,这是减少人为错误的一种方法。
与内部部署的灾难恢复相比,云计算灾难恢复更加简单。通过云计算方法可以简化与管理自己的灾难恢复过程相关的复杂性。例如,测试数据恢复框架不仅更容易,而且更可行。
此外,企业在选择恢复方法时享有很大的灵活性,可以经济高效地组合各种恢复方法,而不会影响他们所需的服务。云计算灾难恢复选项提供高可扩展性,因为服务器和基础设施可以基于现收现付等模型进行扩展。
云计算灾难恢复的最佳实践
(1)选择合适的灾难恢复计划方法
要制定合适的灾难恢复计划,企业了解其IT基础设施非常重要。通过这种方式,可以选择正确的灾难恢复计划方法。可以使用备份和恢复方法,这需要使用托管备份解决方案在其方便时处理数据的备份和恢复。
根据企业的要求,Pilot Light拓扑可能是有效的。这种方法通过减少活动资源来降低灾难恢复的成本,由于关键数据和应用程序都在一个地方,因此在面对灾难时更容易恢复数据。其他方法包括热备用,它具有部署在两个或更多活动位置的数据和应用程序的完整副本,以及热备用,它具有系统核心元素的副本并与系统同时运行。
(2)选择具有能力的灾难恢复服务提供商
战略性灾难恢复评估和规划必须有彻底定义的程序,企业可能无法自行执行。例如,灾难恢复服务提供商可以帮助企业进行彻底的业务影响分析,以帮助熟悉在灾难期间可能遇到的操作限制。
因此,选择能够帮助制定有影响力的云计算灾难恢复计划的智能、务实且以解决方案为导向的服务提供商非常重要。这样的服务提供商将为企业的用例提供正确的工具。他们还可以对企业的数据的潜在危险进行更好的评估。
(3)为企业的灾难恢复计划定义恢复点目标(RPO)和恢复时间目标(RTO)
在制定企业的灾难恢复计划时,恢复点目标(RPO)和恢复时间目标(RTO)是有价值的指标。它们在特定服务中断期间提供业务连续性的保证。
恢复点目标(RPO)可以帮助企业了解在灾难期间可接受的数据量损失。另一方面,恢复时间目标(RTO)控制企业的基础设施在灾难后实现正常运行所需的速度,并涉及减灾和恢复的步骤。因此,考虑恢复点目标(RPO)和恢复时间目标(RTO)有助于企业决定什么灾难恢复框架以满足其恢复目标。
(4)定期测试和更新计划
灾难恢复计划的例行测试可以衡量计划在发生灾难时的预期效果。此外,由于灾难恢复目标应该与业务目标保持一致,业务格局的不断演变使得始终测试灾难恢复计划以确保它们不会过时变得更加必要。
信息技术也在不断发展。因此,为了跟上技术进步,企业的基础设施必须相应地发展,不仅要通过测试,还要更新灾难恢复计划,以确保逐步提高计划的效力。
(5)考虑灾难恢复即服务
当企业缺乏内部灾难恢复团队时,灾难恢复即服务(DRaaS)成为一种可行的选择。DRaaS提供商可能会为企业提供量身定制的最佳实践,以满足他们的业务需求。由于DRaaS使用云计算资源,因此它很容易成为创建基础设施的一种手段,以在面临灾难时保护企业的关键任务数据。
DRaaS还为企业节省了资金,因为得到了他们所支付的费用。例如,有了这样的计划,最终不会为不会使用的存储空间付费。此外,与内部解决方案相比,DRaaS可以在灾难发生后提供更快的恢复时间。