拥有大量的数据对于组织来说是一种法律要求,也是一种责任。
许多组织仍然依赖磁带进行数据备份,但在日益数字化的世界中,他们是否应该这样做?
当一家组织询问是否应该将所有备份数据从磁带传输到云存储时,这成为了一个令人关注的问题。该组织涉及的数据总计2PB,存储在几百个磁带上,涵盖了过去五年的数据备份。该组织正在探索将其转移到云端的想法,并采用了磁带数据恢复服务。乍一看,外包解决方案的成本似乎很高,因此需要其他的建议。
该组织了解自己想要实现的目标,关键问题是为什么他们认为这对其业务是必要的措施。这不仅仅是磁带和云存储各有自己优势的问题。他们需要解决的问题是:如何使用每周和每月精心备份的数据。换句话说,为什么要存储这么多数据,真的需要这些数据吗?如果需要的话,如何更快地访问所需的数据?
磁带仍存在于云中
磁带如今已经存在和使用了很长一段时间,并且存储容量很容易扩展。但是也有一些难以克服的问题。例如并不可靠,在紧急情况下可能不容易恢复数据。大多数内部IT团队都不喜欢使用磁带备份,因为磁带备份有失败的可能。尽管如此,对于长期数据保留和非现场归档,仍然是一种有效且廉价的选择,而且许多公司仍然对它有一定的依赖性。
事实上,云存储也使用磁带长期存储数据。例如, 如果查看Microsoft Azure中的blob存储,就会发现存储在磁带上的数据。AWS Glacier也是如此,其磁带只是隐藏在云存储技术的背后,因此,用户可能并没有意识到这些,除非他们询问云计算提供商。换句话说,通过将数据从磁带移动到云端,组织不一定要选择技术上更可靠的存储介质,但可恢复性的问题就交给了云计算提供商。是否更改存储介质的决定与存储策略有关,而不是技术。
磁带索引可能不足
为了评估磁带到云存储的建议,组织必须决定他们想要什么,以及认为有必要这样做的原因。如果希望能够按日期恢复(因此在某个日期验证文件的状态),则需要保留所有数据。如果他们希望按文件夹、文件名或块进行恢复,这将使他们能够使用重复数据消除来删除保存的同一文件的多个副本,因此需要的存储空间将会显著减少。通常,重复数据消除2PB的数据会将其减少到原始大小的15%~20%,这将使该公司需要大约300~400TB的存储空间。
他们还需要考虑如何搜索想要检索的数据。即使要查找诸如姓名之类的特定数据,也需要计算机取证技术,例如磁带索引上没有足够的细节来说明某人在某日发送了带有附件的电子邮件(尽管最近的存储系统包括这种类型的搜索功能)。而恢复文件或文件夹要容易得多。
如果可以恢复的内容对业务没有用处,那么在这两种解决方案上都不值得投资。如果不检查数据的完整性并对所有的磁带进行编目和索引,那么要做到这一点绝非易事。
外包磁带解决方案提供商曾提出对数据进行分类,并对每一盘磁带进行审查,这也是成本高昂的原因之一。然后,客户可以一次性检索所有数据,或者购买保险单来选择要恢复的磁带。它们可以通过TFTP或客户提供的NAS进行访问以进行恢复。
更多数据是法律要求还是法律责任?
在这一点上,每个组织都必须考虑到它实际需要存储数据的目的,以便制定其备份策略。由于监管或法律原因,可能需要承担数据恢复的费用。例如,在受监管的环境中,需要遵循萨班斯-奥克斯利法案(Sarbanes-Oxley),因此组织拥有正确的备份策略至关重要。
但是在其他情况下可能会有大量数据。搜索文件和检索数据可能带来不必要的成本,并且会干扰日常业务。例如,在GDPR法规要求下,组织保存更多的数据将增加响应的时间和成本。
每个组织都必须问自己以下这些问题:
•检索特定数据需要多长时间?
•检索到这些数据后,这些数据对组织有什么价值?
•保留特定类型的备份对业务有何好处?保留这些备份的成本是多少?
在定义其策略时,组织应同时考虑合规性。无论它决定保留多少数据,它都应能够证明已尽其所能响应所收到的任何数据请求。
这应该包括一个清晰的获取和处理备份的过程,对存储时间有一个时间限制,以及一个销毁旧数据的过程。组织需要计算出所需的最少数据是多少,最终只保留需要的数据。例如,对于五年以上的数据,可能应该决定只保留某些特定的数据。同样,更新的备份产品使这一点更加容易。
在某些行业领域(如建筑业),组织在项目关闭时对所有重要的内容进行最终备份,然后应删除所有其他来源的物理文件或副本。这些备份必须是永久性的(或者至少是很长的时间)。随着每五年推出一次新的备份解决方案,必须确保这些现有的归档文件仍然可以访问,并在必要时将其存储到新介质。云存储至少能解决存储媒介变化的问题。
云原生组织实施云备份更加容易
对于没有采用磁带存储的组织来说实施云备份要容易得多。在基于云计算的系统中,启用重复数据删除和压缩后,数据存储就不再是一个难题。Veeam等产品可永久提供增量备份。这意味着从理论上讲,它们只保存每个文件的一个副本,并只记录更改。然后,可以每周或每月编写一次合成的完整备份,并且可以恢复所有数据。保留期限的设置是标准的,搜索功能显著提高。Office 365和Druva还提供了复杂的索引编制和搜索功能,从而可以在核心文件中定位和查找数据。
但是,使用磁带备份的组织面临着同样的困境。他们可能想知道需要做出什么决定。例如决定将辅助备份移至Microsoft Azure,因此他们不再采用大量的磁带进行存储。有些组织仍在评估是选择将原有数据传输到云平台还是将其保留在NAS上并自行编目。但是,他们现在需要了解其决策背后的战略,并制定可靠的备份策略。