如果RAID阵列崩溃你能想到哪些好的补救方式,学会这一步颠覆你以往认知。

一、存储故障概述

1、故障环境

两组分别由4600G容量的SAS硬盘组成的raid5阵列,并且两组阵列划分LUN,组成LVM结构,并格式化为EXT3文件系统

2、故障分析

一块硬盘意外离线,热备盘上线,顶替离线硬盘。但在热备盘上线过程中,又一块硬盘离线,导致热备盘同步失败,两组raid阵列中的一组崩溃,LVM结构不完整,文件系统无法正常使用。对两块离线硬盘进行检测,发现先离线硬盘无法识别,初步推断是硬件故障,需要进行开盘修复操作,另一块硬盘可以识别。

二、解决方案概述

根据前期的故障分析结果,总结出以下解决方案:

1、 对故障硬盘进行修复,使用MRT专业数据恢复软件对故障硬盘进行备份。

2、 使用专业数据恢复软件winhexraid其余成员盘和另一组raid全部成   员盘进行全盘备份

3、 分析每个硬盘的数据,根据分析的结构重组RAID 阵列。

4、 分析重组完的阵列,找到LVM信息,重组LVM

5、 对重组的LVM卷上的EXT3文件系统进行解析,恢复并导出全部数据。

三、实施解决方案

1故障盘修复

对故障硬盘进行开盘修复操作。开盘后发现,硬盘盘片磨损严重,已无法修复,只能对阵列进行缺盘处理。

2硬盘备份

使用专业数据恢复软件winhex对故障raid阵列的其余成员盘进行全盘备份,并且对另一组好的raid阵列的全部成员盘进行全盘备份,备份情况如下:

 

3重组raid阵列

仔细分析硬盘底层数据,通过对EXT3文件系统结构进行解析,分别分析出两组raid阵列的盘序、条带大小、校验方向等配置信息,使用专业数据恢复软件winhex重组出两组raid阵列经分析,两组raid阵列块大小都为64K,校验方向为做同步,对故障raid进行重组时注意进行缺盘处理。

 

4重组LVM结构

重组出两组raid阵列之后,对两组raid中的底层数据进行分析,找到LVM结构信息,对LVM结构进行分析,将两组raid中作为PVLVM物理卷)的LUN导出,然后使用专业数据恢复软件UFS Explorer将两个PV重组,重新生成LVM逻辑卷。

 

5、恢复数据

LVM重组之后,对LV(逻辑卷)中的EXT3文件系统进行解析,恢复并导出其中的全部数据。以下为回复出来的数据:

 

数据校验

对恢复出来的数据,挑选部分压缩文件等进行校验,发现部分文件损坏,对解析结果和恢复结果对比,发现部分文件损坏且无法恢复。经过分析,初步推断文件损坏与两组raid中部分硬盘存在坏道有关。以下为两组raid中部分硬盘坏道情况:

Raid 12#   67 bad source sectors encountered.

4#   13 bad source sectors encountered.

Raid 22#   37 bad source sectors encountered.

恢复结论

由于故障硬盘损坏严重,硬件无法修复,并且部分硬盘存在坏道,导致raid结构中可能存在缺陷,部分文件损坏,但大部份文件经验证后恢复成功,只有小部分文件丢失或者损坏,本次数据恢复成功完成。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

posted on   北亚数据恢复  阅读(420)  评论(0编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 通过 API 将Deepseek响应流式内容输出到前端
· AI Agent开发,如何调用三方的API Function,是通过提示词来发起调用的吗

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示