【服务器故障单位】
北京某公司
【服务器数据恢复故障描述】
客户有一台IBM X3650 M4服务器,服务器上配置了8块硬盘,组成raid5磁盘阵列,服务器在运行过程中有2块硬盘报警,随后系统便无法启动,服务器上层运行的2003系统ORACLE数据库,现在也无法启动了,急需进行服务器数据恢复操作。
【服务器数据恢复故障分析】
RAID5存储结构提供的磁盘冗余功能仅限于一块存储介质,若有另外一块磁盘发生离线,整个阵列便会崩溃,不能正常工作。由于客户确认之前没有第二块硬盘离线,所以初步认定RAID卡上的RAID信息可能已经丢失或破坏。
【服务器数据恢复过程】
1、对8块硬盘及未进行完全同步的新硬盘,进行异或测试,无明显错误。
2、备份全部硬盘部分关键区域。
3、在备份过程中同时分析原RAID组成结构,构建虚拟RAID环境。
4、验证RAID结构是否正确。
5、阵列结构无明显错误,目录结构及文件路径完整。
6、修改个别硬盘上的RAID信息。
7、将RAID信息导入到RAID卡,重新启动。
8、阵列可以正常工作。
9、及时加入热备盘,进行同步,让RAID回到同步状态。
【数据恢复结论】
因为异或测试完全通过,所以表明该存储故障主要是由于RAID控制器出错,丢失RAID信息造成。
恢复完成后,目录结构完整,ORACLE数据库完好。客户认可所恢复的数据,恢复成功。
原文地址:https://blog.51cto.com/sun510/3251132