华为服务器更换raid卡,故障处理记录

华为服务器无法开机+kylin v10 server

更换raid卡后可以开机(可是无法正常进入操作系统),进系统过程中报错,让进入单用户模式修复,或ctrl+d继续,是因为更换raid卡后,raid信息损坏(有可能需要重建raid),进入单用户后执行mount -a挂载所有设备,会报错有的设备挂载不上,之后vi /etc/fstab 找到对应设备注释掉后,重启后可以进入到正常的系统登录界面。(就是因为无法正常挂载fstab中的文件系统所以才在启动过程中报错)

进入操作系统后发现有几块硬盘没有识别到,在bmc系统中发现,一个raid卡下面共8块盘,其中4块做的raid5,下面的4块没有被系统识别(需要在bmc系统,存储设备选项配置硬盘模式为JBOD直通盘模式,就是不做raid可以直接挂载系统中使用,也可以在BIOS里设备硬盘固件模式为JBOD),配置完后进系统lsblk查看发现可以识别到另外的4块盘了,然后打开vi /etc/fstab去掉注释行后mount -a还是无法正常挂载,思路是lvs 、vgs查看是否有对应的逻辑卷和卷组,检查lv和vg的状态,发现由于更换raid卡后发现vg状态不是激活状态,vgchane -ay  vgname 激活卷组后再次mount -a就可以了。

lsblk  查看文件系统及挂载点

blkid 查看lv文件系统格式是xfs还是ext4.

lvs、vgs、pvs等同于lvdisplay、vgdisplay、pvdisplay

 

如果因为更换raid卡导致文件系统损坏可以尝试使用xfs_repair修复文件系统,修复前要umount文件系统。

挂光盘,光盘启动进入救援模式。

umount  /dev/mapper/vg00/lv-root  卸载需要修复的文件系统

xfs_repair  -L (或不加) /dev/mapper/vg00/lv-root    修复完后可以   echo $? 查看下返回值是否为0。 

 

posted @ 2024-06-24 16:45  song宁静致远  阅读(91)  评论(0编辑  收藏  举报