记一次K8S集群Node节点CPU消耗高故障
- 故障现象
K8S集群CPU消耗99%
查看是一个pause进程导致
kill进程后过一会会自动启动 - 故障原因
集群启动了镜像quay.io/pubproxy/pause 的daemonset 并且启动了多个 - 处理方法
删除所有已quay.io/pubproxy/pause 镜像启动的daemonset
# kubectl delete daemonset -n kube-system docker-container
# kubectl delete daemonset -n kube-system kube-controller-scheduler
# kubectl delete daemonset -n kube-system kubernetes-external-secret
# kubectl delete daemonset -n kube-system service-clusterip
这些镜像都不是安装的时候带的,可能是K8S集群的漏洞