kubernetes之故障现场二,节点名称冲突
问题描述:测试环境由于异常断电导致服务器重启一后,有一个节点的状态一直是NotReady
.通过journalctl -f -u kubelet
没有错误日志输出.通过tail /var/log/messages
查看日志信息,发现有输出日志avahi-daemon[24276]: Host name conflict, retrying with k8s-node5-08
这样的错误.经过排查这是由 于avahi
的一个bug造成的.截至目前该问题已经修复,但是新的版本还没有发布.
目前的解决办法是先把这个节点从集群中删除(kubectl delete node k8s-node5),由于apiserver现在已经无法同这个节点进行通信,因此pod驱离也无法进行,只能够先删除节点了.删除完成以后,重命名该节点的名称(hostnamectl set-hostname xxx
),然后执行kubeadm reset
重置该节点,然后再重新加入集群,问题算是得到解决.