一次master节点notReady的修复过程

这天打开电脑,发现master节点的状态异常,是notReady状态。其他计算机点还好时Ready状态。

检查etcd集群状态

首先通过命令etcdctl member list确认etcd集群是OK的。

检查master节点各个进程状态

这时检查master节点上的各个kube相关进程都在. 但通过systemctl status kubelet,kubelet的的进程显示如下:


于是重启kube-proxy和kubelet,查看进程状态正常。但奇怪的是过了一会kubelet状态又异常了。这时我使用命令 kubectl delete node k8s-master删除了这个master-node.但是这个node一直注册不到集群中。
这时查看kubelet的log文件显示如下:

因此可以判定是认证文件出了问题。

检查证书

首先通过命令 kubectl get cs查看获取集群状态,显示如下:

使用命令kubectl get csr查看证书状态,显示如下:

使用命令kubectl certificate approve node-csr-qwDqWMuffouPtl2DIqz8NN3cB9R-DvBg_ULg6mYrEKUapprove CSR 请求,最后重启kubelet就可以了。但因为之前把这个节点删除了,所以需要给这个节点打上所需要的label.

posted @   JaneySJ  阅读(5040)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示