自从2020年初发生新冠疫情以来,人们被迫面对这一严峻的现实,危机可能以多种不可预测的形式出现。几乎在一夜之间,这场疫情让很多企业的员工在家远程工作,并将网络延伸到了极限。美国德克萨斯州在今年2月经历了一场严重的冬季风暴,导致该州电网瘫痪,还有肆虐美国西部、澳大利亚和南美洲的野火,以及全球其他恶劣天气事件。这些灾难造成严重的经济损失,其不利影响可能持续数年甚至数十年。
对于数据中心运营商来说,认为当前的基础设施及其强大的备用电源系统不会受到危机影响的这一观点将是一个巨大的错误。气候变化每年导致越来越多的极端天气事件,美国每年发生的自然灾害造成数十亿美元的损失。例如美国30多个城市在今年夏天的气温再创历史新高。根据Uptime Institute公司日前发布的一份报告,60%的受访者认为气候变化的直接影响将导致更多IT服务中断,近90%的受访者认为气候变化将在未来10年推高数据中心基础设施和运营成本。
除了气候变化之外,最近发生的一些事件表明,当遭遇灾难性的网络攻击时基础设施是多么脆弱。所有这些危机都是对数据中心的重大威胁,人为错误、准备不足和判断力差可能会使这些情况变得更糟。这就是现在是企业制定计划以在紧急情况下保护其数据中心的最佳时机的原因。一个优秀的应急计划应该是一份具有生命力的文件,是正在进行的计划、练习和更新的指南。以下是企业制定计划时需要考虑的一些关键因素。
- 确保数据中心防水——如果面临的威胁与飓风、洪水或与天气有关,需要采取必要的措施来加固数据中心设施。首先确保服务器固定在机架中,然后检查排水沟和雨水渠是否畅通。并确保大门可以密封以防止大风和大雨。由于水是数据中心设备的大敌,因此需要采取一切必要措施将其拒之门外。
- 经常备份数据——许多数据中心每周进行一次例行备份。如果知道恶劣天气即将来临,需要增加数据备份的频率。由于无法知道灾难何时会发生,因此企业应该考虑将每日备份作为常规做法。此外,需要考虑数据的备份位置,它应该离开现场转移到安全可靠的地方。
- 始终检查备用发电机—提供备用电源的柴油发电机器需要维护和保养,以确保其在需要时按预期运行。需要查看是否加满燃料。燃油管路和空气滤清器是否有污染物,在任何预期的天气事件发生之前还要定期测试发电机。在停电时间延长的情况下,安排多家供应商来运送燃料。需要记住的是,燃料价格通常在灾难发生之后非常昂贵。
- 考虑边缘站点的安全——如今,企业数据中心只是分布式网络中的一部分。许多企业管理着多个边缘站点,这些站点的任务越来越关键,在灾难规划中必须考虑到这些站点的安全。在许多情况下,核心数据中心可能不会受到特定事件的影响,但一个或多个边缘站点可能面临风险。因此需要按关键程度确定优先级,并为这些边缘设施及其运营和维护人员制定安全计划。
- 关注云平台——某些数据和应用程序位于云平台中,并不意味着它们始终可以免受紧急事件的影响。这些云计算服务器在某个数据中心运行,企业应该知道其云计算提供商将如何处理潜在的灾难。多久备份一次数据?有多余的站点吗?在危机发生之前需要问这些问题,因为一旦灾难发生,就为时已晚。
- 考虑应急人员配备——如果发生重大灾难,数据中心当地的员工可能无法正常工作。他们可能已经与家人一起疏散转移,或者正在紧急处理损坏的房屋或车辆,或者由于道路无法通行而无法到达数据中心。企业需要考虑在附近为应急人员提供应急住房,以确保有现场人员的响应。
- 提防机会主义者——黑客将自然灾害或类似的紧急事件视为入侵网络的机会,而企业可能将注意力集中在其他地方。因此,企业需要确保其信息安全和物理安全团队为应对不良行为者做好准备。
环境和人员的变化、设备老化和更新,各种风险可能随着时间的推移而演变。企业为了确保其数据中心在灾难发生时准备就绪,因此必须制定灾难恢复清单。