Openstack+Ceph 宿主机意外重启导致虚拟机无法启动的情况
由于宿主机意外重启,导致此台宿主机上的所有虚拟机都无法启动
控制台显示如上
如果是windows主机的话,会显示蓝屏,也是无法进入系统
摸索半天,发现应该是ceph权限问题,在libvirt的日志中可以看到
2022-09-26T09:40:21.630131Z qemu-kvm: rbd request failed: cmd 1 offset 21645035520 bytes 524288 flags 0 task.ret -13 (Permission denied) 2022-09-26T09:40:21.633661Z qemu-kvm: rbd request failed: cmd 1 offset 21645559808 bytes 1572864 flags 0 task.ret -13 (Permission denied) 2022-09-26T09:40:21.656222Z qemu-kvm: rbd request failed: cmd 3 offset 0 bytes 0 flags 0 task.ret -13 (Permission denied)
后来偶尔发现只要把云主机镜像export,在import,虚拟机就可以正常了,原因不明
openstack server stop $VMID rbd export Openstack-VMs/${VMID}_disk /root/Old_VMs/${VMName}_${VMID}_disk_$date rbd rm Openstack-VMs/${VMID}_disk rbd import /root/Old_VMs/${VMName}_${VMID}_disk_$date Openstack-VMs/${VMID}_disk openstack server start $VMID
这样就可以启动了,但是也很麻烦
但是之后发现不管云主机系统盘,挂载的盘也是会有这样的问题,IOError,这盘有1T大小,这么搞要累死
摸索了下,其实只要rbd map一下,在unmap掉就行了
rbd map Openstack-VMs/${VMID}_disk rbd unmap Openstack-VMs/${VMID}_disk
好奇怪的问题,倒是解决了,不过原因还是没找到,有人碰到过可以指点下不