修复一例 VMware vSphere 6.7平台虚拟机无法启动的故障

修复一例 VMware vSphere 6.7平台虚拟机无法启动的故障

原创2023-02-01 18:38·每天一点IT

机房半夜停电时间过长,UPS没撑到电力恢复,结果平台上的大部分业务虚拟机都无法启动,且名称变成数字乱码,造成的后果很严重,因为主要业务都无法访问了,真是惊恐万分,心都凉了,还好冷静下来分析故障原因,最后总算修复了,全部虚拟机最终恢复正常启动运行,数据也未丢失,特此给大家分享一下解决方法。

故障平台:VMware vSphere 6.7

故障现象:平台虚拟机均无法正常启动,名称变成数字乱码。

先是查看了下vCenter Server 的事件选项卡,看到存在数据存储损坏问题事件。

然后查看vmkernel.log 日志文件,看到了类似如下所示的错误信息:

Volume 40fd60a3-3abbe1ae2-3247-0017a4bb0402 ("<Datastore_XX>") may be damaged on disk. Corrupt heartbeat detected at offset 3305972: [HB state 0 offset 605284589918532624

到官网知识库扒了一下,说是遇到这种情况需要检查元数据一致性。

操作方法:开启ESXI主机SSH服务,从 ESXi 主机上的 CLI 中运行 VOMA。VOMA 可用于检查并修复 VMFS 数据存储或支持 VMFS 数据存储的逻辑卷的轻微不一致问题。

VOMA相关功能如下图一:

image-20230821100427535

VOMA相关命令如下图二:

image-20230821100445173

具体修复过程:

1、先开启ESXI服务器的SSH服务,使用root帐号连接到服务器的CLI控制台。

2、查看/vmfs/devices/disks下的虚拟磁盘,假定要修复的是eui.225c0032654ccba5:1,

输入命令voma -m vmfs -f check -d
/vmfs/devices/disks/eui.225c0032654ccba5:1,再按下回车键,让它进行vmfs文件系统元数据检查,若发现类似“ON-DISK ERROR:xxxxx”这样的信息,表明vmfs元数据确实有错误。

3、最后使用命令voma -m vmfs -f fix -d
/vmfs/devices/disks/eui.225c0032654ccba5:1修复vmfs元数据。关注下修复结果:Total Errors found;Total Errors Fixed,如果都有数字,表明修复成功了。

4、最后验证修复结果,如果虚拟机都恢复正常启动,表明方案有效,如果没有正常启动,可尝试重新注册虚拟机后,再次重新启动虚拟机,若成功表明方案有效,若以上方法试过,还是无法正常启动虚拟机,表明该方案药不症,需要再次查看相关日志,查找下相关知识库,对症下药。

5、建议虚拟化平台的相关操作应该慎之又慎,因为平台往往有很多虚拟机及大量数据,涉及业务面广,出现故障是灾难性的,因此平时最好利用专业数据备份软件或者官方的Site Recovery加强对虚拟机的保护。

如果你能看到这里,麻烦动动你那充满爱心的善良之手点下关注吧,专业文章受众面小,技术博主攒粉不易啊。

posted @ 2023-08-21 10:05  寻梦99  阅读(1023)  评论(0编辑  收藏  举报