随笔分类 - 高可用 R6
摘要:故障现象: kingbase数据库容量不足100G,业务繁忙程度小,但是每天产生112283个WAL日志,每个日志16M,生成约1.7T的归档日志 分析过程: 思路一:从数据库日志入手,分析过程如下: sys_log日志: 2024-06-02 23:54:05.497 CST 31303 61b5
阅读全文
摘要:案例说明: 主库主机系统重启,触发failover切换,原主库系统启动后,数据库服务被启动,出现“双主”,使用“repmgr node rejoin --force-rewind”恢复集群。通过本案例了解,集群“双主”产生的原因及解决方案,并熟悉sys_rewind在集群恢复中的应用。 数据库版本:
阅读全文
摘要:案例说明: 对于主备流复制集群,在运行过程中,因为主备节点之间网络故障、或者failover切换后原主库误启动等,会造成集群“双主”的故障,导致应用数据被写入到不同的主机,数据分裂。本案例描述了在生产环境出现“双主”故障时的解决方案。 适用版本: KingbaseES V8R6 操作步骤: 1、查看
阅读全文
摘要:案例说明: KingbaseES V8R6集群在使用sys_monitor.sh启动集群时,将会在主库节点加载vip;生产现场,在启动集群时,加载vip失败,本案例详细描述了问题解决的过程。 适用版本: KingbaseES V8R6 操作系统: kylin信安 问题解决思路: 1. 通过ping测
阅读全文
摘要:案例说明: KingbaseES V8R6集群可以通过执行'repmgr clone standby' 创建备库,在一些场景,执行clone命令出现故障时,可以通过执行sys_basebackup命令分析和排除故障。本案例详细描述两种方案创建备库的区别。 适用版本: KingbaseES V8R6
阅读全文
摘要:案例说明: 某生产环境,KingbaseES V8R6集群主库系统异常触发主备failover切换,集群切换成功,客户需要了解触发failover切换的原因。本案例通过日志分析,详细描述了触发此次集群failover切换的原因。 适用版本: KingbaseES V8R6 集群节点信息: x.x.x
阅读全文
摘要:案例说明: KingbaseES V8R6集群,一主多备架构,其中一个备库节点,在使用‘repmgr cluster show’查看集群状态时,出现"conninfo": invalid connection option "tcp_user_timeout"错误,其余节点正常。故障现象如下所示:
阅读全文
摘要:案例说明: KingbaseES V8R6单实例生产环境需求在线扩展为流复制集群架构,本案例描述了从单实例在线扩展为流复制集群的过程。(本案例在通用机环境下测试,专用机环境可参考) 适用版本: KingbaseES V8R6 集群节点信息: [kingbase@node201 bin]$ cat /
阅读全文
摘要:问题现象 在数据库运维中,查询到某个表时,报错信息如下: ERROR: catalog is missing x attribute(s) for relid xxx 或者 错误: catalog 遗失了 relid为 xxx 的 x 个属性 报错原因 这个错误通常与系统表(如 sys_class,
阅读全文
摘要:背景 回顾一下流复制冲突相关参数: hot_standby_feedback: 从库反馈给主库快照, 主库vacuum时不回收最老快照之后产生的垃圾,注:备库长查询将导致主库表膨胀。 vacuum_defer_cleanup_age: 当触发vacuum时,延迟指定事务后触发。 recovery_m
阅读全文
摘要:KingbaseES V8R6集群运维案例之 同城双中心switchover案例 案例说明: 在同城双中心执行switchover在线切换后,双中心架构保持不变。 适用版本: KingbaseES V8R6 集群架构: 一、切换前集群节点状态 如下所示,切换前集群的主库(Primary)位于同城灾备
阅读全文
摘要:案例说明: 在通用机环境下,通过脚本部署集群,出现“initdb: error: cannot be run as root”故障。 适用版本: KingbaseES V8R6 一、问题现象 通用机环境,通过脚本部署集群,出现以下故障:在对主库执行initdb初始化实例时,是root用户执行,而不是
阅读全文
摘要:KingbaseES V8R6集群运维案例之 备节点恢复为单实例库 案例说明: 在生产环境中,手工将集群节点恢复为单实例节点,操作可以分为两步。第一步,先将节点从repmgr管理中注销,脱离集群的管理;第二步,从流复制中拆分节点,成为单实例节点。 适用版本: KingbaseES V8R6 集群架构
阅读全文
摘要:案例说明: 本案例描述了在KingbaseES V8R6下部署同城双中心集群的过程,通过脚本的方式执行执行部署,部署方式和普通集群脚本部署基本一致。 适用版本: KingbaseES V8R6 集群架构: [kingbase@node101 ~]$ cat /etc/hosts 192.168.1.
阅读全文
摘要:案例说明: KingbaseES V8R6集群物理备份配置参数_target_db_style,可选single或cluster或single-pro。 single对应单机模式的目标数据库实例,cluster对应集群模式的目标数据库实例,single-pro对应集群模式的每个DB节点独立备份。本案
阅读全文
摘要:案例说明: KingbaseES V8R6集群在数据库实例启动时需加载repmgr插件,并且具有集群管理的用户esrep和存储元数据的数据库esrep库;但在手工initdb新的实例后,默认的实例将不包含repmgr extension及esrep库和esrep用户,需要手工配置,完善集群管理应用。
阅读全文
摘要:案例说明: 在KingbaseES V8R6 一主二备(其中一个级联备库)集群架构中,通过sys_monitor.sh启动集群时出现 'ERROR: There are no 2 standbys in pg_stat_replication, please check all the standb
阅读全文
摘要:案例说明: KingbaseES V8R6集群通过脚本部署,默认字符集是utf-8,可以通过修改部署配置参数支持其他类型的字符集。 适用版本: KingbaseES V8R6 一、部署故障案例 1、在执行部署脚本时出现以下故障: 2、查看install.conf配置 3、查看系统字符集 [kingb
阅读全文
摘要:案例说明: 在一主多备的架构中,需要配置一台备库在主备切换时,不能选举为主库。对于repmgr主备切换主库的选择算法如下: Tips: Repmgr选举候选备节点会以以下顺序选举:LSN >Priority > Node_ID。 系统会先选举一个LSN比较大者作为候选备节点;如LSN一样,会根据Pr
阅读全文
摘要:KingbaseES V8R6集群运维案例之 级联备库upstream节点故障 案例说明: 在KingbaseES V8R6集群,构建级联备库后,在其upstream的节点故障后,级联备库如何处理? 适用版本: KingbaseES V8R6 集群架构: 案例一: 一、配置集群的recovery参数
阅读全文