KingbaseES V8R6备份恢复案例之---备份初始化‘more than one primary cluster found’故障
案例说明:
KingbaseES V8R6集群在龙芯架构下部署为pg模式,在执行‘sys_backup.sh init’时,出现‘more than one primary cluster found’的故障,初始化失败。并且在读写分离中,应用无法找到正确的主节点。
适用版本:
KingbaseES V8R6
一、问题现象
如下所示,执行‘sys_backup.sh init’和读写分离的故障,都是无法有效识别到集群主节点:
1、sys_backup.sh init故障
2、读写分离故障
二、问题分析
1、查看集群状态
如下所示,集群当前主备状态正常:
2、查看sys_backup.conf配置
如下所示,备份采用cluster模式备份:
3、查看生成的sys_rman.conf文件
如下所示,和正常的sys_rman.conf对比,配置文件中缺失了备节点ip的配置:
正常的cluster模式的sys_rman.conf配置:
4、执行'sh -x sys_backup.sh init'
如下所示,在脚本通过ip+mac地址判断连接的是否为同一节点时,发现主备节点ip有mac地址相同,导致无法获取另外节点的ip:(对于Cluster模式的备份,将在sys_rman.conf中写入kb2-user,kb2-host的信息)。 获取到主备节点的mac地址相同,在sys_rman.conf中将忽略kb2-host的信息。
正常的系统检测(主备节点ip的mac地址应该不同):
5、查看主备节点网络信息
如下所示,脚本通过以下判断语句判断主备节点获取到相同的网卡mac地址:
判断语句:ip addr |grep 'ether ' | head -n 1 | awk '{print $2}'
三、问题解决
重新配置主备节点网络,解决网卡mac地址重复的隐患后,重新初始化备份。
四、问题总结
对于集群环境,在部署时,需检查系统环境,避免出现系统和网络配置的隐患。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」