一、raid5常见故障介绍
1. 服务器硬件出现故障或者RAID阵列卡故障;
2. 服务器意外断电导致磁盘阵列故障;
3. 服务器阵列上的磁盘出现物理故障,如:电路板坏、磁头损坏、盘面坏、坏扇区、固件坏等;
4. 管理员在维护服务器过程中由于误操作导致硬盘盘序出现错误;
5. raid在同步数据或者重建过程中,同组raid阵列中有其他硬盘掉线导致同步失败;
6. 配置raid阵列信息出错等误操作导致数据丢失。
二、RAID5磁盘阵列故障后需要注意哪些问题
1. RAID5磁盘阵列出现故障或者数据丢失后建议不要盲目进行rebuild操作。
Rebuild操作就是利用阵列的校验功能,根据阵列内其他正常硬盘内的数据,将损坏硬盘的数据进行计算生成并同步到热备盘中。这种操作适合阵列中有1块硬盘掉线的情况,一旦阵列中有2块硬盘出现故障掉线了,则通常掉线顺序有先有后,如果在第一块硬盘掉线后服务器已经进行过写入操作的话,此时第一块掉线的硬盘数据已经久不更新,rebuild只能对先掉线的磁盘做Rebuild,如果对后掉线的磁盘进行重建操作,部分阵列虽然能正常工作,但数据错乱,一些文件不能打开,给用户带来不可挽回的损失。
2. 如果有硬盘掉线不建议盲目进行强制上线操作。
在北亚数据恢复中心恢复的raid5数据恢复案例中,有部分raid阵列数据丢失原因是因为阵列中有一块硬盘离线以后没有及时更换硬盘,此后服务器出现故障或者正常重启,原本离线的硬盘重新上线,而原本在线的硬盘反而故障离线,数据不能正常使用。
用户对后离线的硬盘进行强制上线操作,磁盘阵列进行自动同步,导致数据新旧混乱,服务器数据丢失。因为原来离线的盘又自动上线,大多数阵列卡会检验校验信息,一旦发现校验信息不正确,会重新计算校验信息,致使不能缺盘恢复数据,将会数据恢复失败。
3. 千万不要进行初始化操作。
初始化是一种类似于低级格式化的操作,一旦对阵列进行初始化操作,那么这个阵列内所有硬盘的底层数据将全部被清零,此时将导致阵列数据无法恢复。
4. 重新配置磁盘阵列信息时要保证与原始配置信息一致。
如果需要重新配置磁盘阵列信息时,一定要注意与原始配置信息保持一致,一旦重新配置的参数与原始信息不一致,将导致阵列内多数文件无法打开,造成数据丢失。并且多数服务器都有重新配置阵列信息后自动初始化的功能,这将导致数据无法恢复。
5. 在进行数据恢复尝试前请务必对服务器内的所有硬盘进行扇区级的镜像备份,避免破坏原始数据,如果有条件,可以联系数据恢复中心获取技术指导。
三、RAID5故障数据恢复方案
1. 镜像服务器内所有数据。
按照一定的顺序将服务器内的所有硬盘进行排序编号,然后将每块硬盘进行镜像备份,也可以将服务器携带至北亚数据恢复中心,由数据恢复工程师进行镜像操作。
2. 将镜像文件交给数据恢复中心进行底层数据分析,重组raid阵列,导出用户数据。
3. 对导出的所有数据进行验证,确认无误后重新搭建服务器环境,将恢复的数据迁移回服务器内即可。
原文地址:https://blog.51cto.com/sun510/3392339