10 2023 档案
摘要:背景: 业务在做测试的时候,突然集群不可用了,无法做出变更了,找到我们平台侧,经过排查,发现controller-manager调度器出现问题,经过查看,调度器不可使用, 处理 方案: 删除etcd集群的key 查询etcd集群中的key的数量: #etcd的命令行 etcdctl="/opt/et
阅读全文
摘要:背景: 因为工作中有nj地域需要下线,需要我所有地域的机器包括vip全部换成其他临近地域 问题: 集群中的etcd正常替换,当时保持的是平移,由于历史原因,之前的同学上线都是手动变更,没有发起上线,导致使用的之前的版本,导致etcd只能读,不能写入,而且etcd监控查询是不健康的状态 排查: 检查了
阅读全文