组织构建云计算恢复策略可以最大程度地减少停机时间,并为采用云计算服务的组织提高弹性。
随着全球各地的组织仍在努力应对冠状病毒疫情,对于他们来说,拥有健壮、按需和可扩展的IT基础设施(无论位置在何处)比以往任何时候都更为重要。
即使在传统情况下,IT停机也可能造成巨大的损失。根据Statista公司发布的一个调查报告,服务器停机的平均每小时成本在30万美元至40万美元。鉴于疫情带来的限制,停机时间延长可能是灾难性的后果。
全球各地的组织都在采用云计算基础设施和现代化技术,以提高弹性和正常运行时间。调研机构IDC公司的一项研究表明,北美地区40%以上的组织预计在2021年将大幅增加其在云服务的支出。Gartner公司预测,到2024年,云计算可能占全球企业IT支出市场的14.2%,高于2020年的9.1%。
尽管云计算基础设施有许多优点,但也具有其自身的一系列风险,其中包括大规模的交易量、开放的架构,以及采用多家云计算供应商的服务。组织需要采取特定步骤来应对这些风险,以便在云计算环境中构建业务弹性。
组织还需要优先考虑现代化。全面的现代化战略有助于简化多云环境的资源调配和日常管理,并利用云计算功能实现大规模创新。
组织可以采用以下最佳实践来构建有弹性的云计算策略:
缓解特定于云计算的风险
由于云计算部署通常涉及大规模交易量、开放架构和多个供应商,因此增加了复杂性和易变性。组织还需要同步其云计算平台和内部部署环境以及管理相互的依赖性。云计算还需要对网络连接有着更大的依赖性。
因此,在云计算环境中建立业务弹性需要采取一些特定措施。首先是建立全面的战略,除了使用云计算功能推动创新之外,还要考虑多云环境的资源调配和日常管理。
评估停机时间
组织需要了解各种类型的工作负载,并确定停机时间对这些工作负载的影响。然后,考虑停机时间如何影响业务连续性。例如,面向客户的应用程序(例如电子商务应用程序)的任何停机都将影响组织的收入,也将损害品牌声誉。因此,组织必须努力确保这些应用程序始终平稳运行。
此外,内部部署基础设施通常会出现诸如单点故障或终止支持基础设施之类的问题。组织需要考虑如何解决这些问题,以尽量减少停机时间。同样重要的是,原有IT系统都要用最新的补丁来保护,以确保安全性。
实施策略
提前预测问题并对其进行规划有助于减轻停机的负面影响。组织需要考虑制定灾难恢复计划以确保业务连续性。通过漏洞评估和渗透测试,并采取主动的安全措施。这些策略首先可以防止安全漏洞的发生,而不必在网络攻击发生时做出反应。
以一家要求基础设施正常运行时间为99.999%的组织为例,这意味着一年中预计的最大停机时间为5分钟。要确保这一点,需要与云计算提供商紧密协作,以非常详细地管理配置、存储和其他操作弹性参数。这也意味着通过应用正确的补丁程序和服务包,以及强健的身份访问管理策略,提高安全性。
查看服务等级协议(SLA)并计算停机时间
但是,即使尽了最大的努力,停机有时还是不可避免的。组织需要制定计划以帮助尽快恢复至关重要。
选择合适的云计算提供商
每个云计算提供商都有其固有的优势和劣势。选择与组织的工作负载和应用程序的性质密切相关的云计算提供商是很重要的。如果需要,组织还可以选择可以处理不同工作负载的多云。此外,正确选择合作伙伴不仅有助于对云计算提供商做出正确的选择,而且还确保基于合作关系提供一致的快速支持。
正确的IT基础设施可以确保一切顺利进行,并在发生任何不可预见的事件时帮助组织的业务快速恢复,这对于业务连续性至关重要。因此,组织制定全面的计划以确定、预测和解决停机原因,是构建其更大业务弹性的重要部分。