服务器数据恢复环境:
农科院某研究所DELL某型号服务器;
15块1TB硬盘搭建为RAID5磁盘阵列;
磁盘阵列只包含一个卷组,卷组占用阵列全部空间,该卷组只有一个起始位置为0扇区的XFS裸分区。
服务器故障:
服务器正常运行过程中一块硬盘离线,管理员对磁盘阵列进行数据同步操作,在进行数据同步的过程中又有一块磁盘报警,磁盘阵列同步数据失败,服务器raid阵列崩溃,无法正常工作。管理员联系我们数据恢复中心进行数据恢复。
服务器数据恢复过程:
1、服务器数据恢复工程师检查故障服务器raid阵列中所有磁盘的状态,发现阵列中最先离线的硬盘访问速度缓慢,第二块离线的磁盘有少量坏扇区,其他磁盘无明显物理故障。RAID5阵列只允许一块磁盘离线,当第二块磁盘离线后阵列就无法正常工作。故障服务器的崩溃是因为第二块磁盘的离线造成的,所以第二块磁盘中的数据是本案例服务器数据恢复的关键。
2、对故障服务器中所有硬盘做镜像备份,所有数据恢复操作都在镜像文件上进行,不影响原始磁盘数据。
3、服务器数据恢复工程师对故障服务器中的15块硬盘进行异或测试,测试全部通过,没有发现明显错误。
4、北亚数据恢复工程师计算出第二块离线硬盘损坏扇区位置的数据,并将其写入镜像文件。
5、分析原RAID5的组成结构,构建虚拟RAID环境并验证RAID结构是否正确。
6、将第二块离线磁盘的镜像备份到新硬盘,并将其强制上线,更换第一块磁盘,并对其进行同步。(注意:此过程危险,操作需谨慎!)
7、拷贝数据。
服务器数据恢复结论:
因为异或测试完全通过,从侧面证明了该服务器故障发生后没有写入新的数据或结构被改动过。这种情况下可以根据阵列中其他的好硬盘计算出坏硬盘对应位置的数据。恢复完成后,目录结构完整,重要文档全部完好,FSCK无任何错误提示。用户认可恢复出来的数据。