etcd心跳超时处理过程
摘要:正文不废话 背景原因 日常巡检发现etcd报了心跳超时(大二层,所以可能不在同一交换机下,怀疑网络质量问题) failed to send out heartbeat on time (exceeded the 100ms timeout for .*ms.) 解决方案 调整etcd心跳 排查过程
阅读全文
posted @
2023-04-03 15:09
K&
阅读(1795)
推荐(0) 编辑
ETCD集群瘫痪保障数据恢复集群(3.4有用以上只到强制恢复单节点数据即可,其他按照常规操作就可以恢复集群)
摘要:模拟故障 Node IP State etcd-1 172.21.130.169 True etcd-2 172.21.130.168 Flase etcd-3 172.28.17.85 Flase 主动停止其他两个节点 [root@master2 ~]# systemctl stop etcd [
阅读全文
posted @
2021-05-21 17:15
K&
阅读(1182)
推荐(0) 编辑
ETCD小故障处理积累集合
摘要:丢失数据文件故障处理: etcdctl ${ep} endpoint health status {"level":"warn","ts":"2021-05-20T13:58:58.712+0800","caller":"clientv3/retry_interceptor.go:62","msg"
阅读全文
posted @
2021-05-20 14:27
K&
阅读(8375)
推荐(0) 编辑
ETCD添加删除集群成员过程
摘要:ETCD添加删除集群成员过程 ETCD_INITIAL_CLUSTER_STATE="new/existing" 有两个值new和existing。如果填为existing,则该member启动时会尝试与其他member交互。 集群初次建立时,要填为new,通过测试发现最后一个节点填existing
阅读全文
posted @
2021-05-18 16:25
K&
阅读(2496)
推荐(0) 编辑