K&
随笔 - 71,  文章 - 0,  评论 - 7,  阅读 - 53084

随笔分类 -  ETCD小故障处理积累集合

etcd心跳超时处理过程
摘要:正文不废话 背景原因 日常巡检发现etcd报了心跳超时(大二层,所以可能不在同一交换机下,怀疑网络质量问题) failed to send out heartbeat on time (exceeded the 100ms timeout for .*ms.) 解决方案 调整etcd心跳 排查过程 阅读全文
posted @ 2023-04-03 15:09 K& 阅读(1795) 评论(0) 推荐(0) 编辑
ETCD集群瘫痪保障数据恢复集群(3.4有用以上只到强制恢复单节点数据即可,其他按照常规操作就可以恢复集群)
摘要:模拟故障 Node IP State etcd-1 172.21.130.169 True etcd-2 172.21.130.168 Flase etcd-3 172.28.17.85 Flase 主动停止其他两个节点 [root@master2 ~]# systemctl stop etcd [ 阅读全文
posted @ 2021-05-21 17:15 K& 阅读(1182) 评论(0) 推荐(0) 编辑
ETCD小故障处理积累集合
摘要:丢失数据文件故障处理: etcdctl ${ep} endpoint health status {"level":"warn","ts":"2021-05-20T13:58:58.712+0800","caller":"clientv3/retry_interceptor.go:62","msg" 阅读全文
posted @ 2021-05-20 14:27 K& 阅读(8375) 评论(0) 推荐(0) 编辑
ETCD添加删除集群成员过程
摘要:ETCD添加删除集群成员过程 ETCD_INITIAL_CLUSTER_STATE="new/existing" 有两个值new和existing。如果填为existing,则该member启动时会尝试与其他member交互。 集群初次建立时,要填为new,通过测试发现最后一个节点填existing 阅读全文
posted @ 2021-05-18 16:25 K& 阅读(2496) 评论(0) 推荐(0) 编辑


< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示