Loading

数据守护集群部署(两节点实时主备)

环境说明

实例名 PORT_NUM MAL_INST_DW_PORT MAL_HOST MAL_PORT MAL_DW_PORT
GRP1_01 32141 33141 192.168.44.173 61141 52141
GRP1_02 32142 33142 192.168.44.177 61142 52142

数据准备

配置数据守护之前,必须先通过备份还原方式同步各数据库的数据,确保各数据的数据保持完全一致。主库可以是新初始化的数据库,也可以是正在生产、使用中的数据库。不能使用分别初始化库或者直接拷贝数据文件的方法。
如果是初始搭建环境,可以通过对主库脱机备份、对备库脱机还原的方式来准备数据,如果主库已经处于运行状态,则可以对主库进行联机备份、对备库脱机还原的方式来准备数据。

初始化实例:

分别在三台主机上初始化实例:一般情况下初始化实例完成之后要将数据库正常的启停一次。

./dminit path=/dm8/data instance_name=GRP1_01 db_name=zhubei port_num=32141 #初始化主库实例 GRP1_01  
./dminit path=/dm8/data instance_name=GRP1_02 db_name=zhubei port_num=32142 #初始化备库实例 GRP1_02  
./dminit path=/dm8/data instance_name=DMDW db_name=DMDW port_num=5236 #初始化监视器实例 DMDW

备份还原:

通过备份还原方式同步各数据库的数据,确保各数据库的数据保持完全一致。

backup database '/dm8/data/zhubei/dm.ini' full backupset '/dm8/back/BACK_FILE_1'  #脱机备份主库
scp -r /dm8/back/BACK_FILE_1/ 192.168.44.177:/dm8/back/BACK_FILE_1/              #将备份拷贝到备库
restore database '/dm8/data/zhubei/dm.ini' from backupset '/dm8/back/BACK_FILE_1' #还原备库
recover database '/dm8/data/zhubei/dm.ini' from backupset '/dm8/back/BACK_FILE_1' #恢复备库
recover database '/dm8/data/zhubei/dm.ini' update db_magic #更新数据库魔数

此时,主备库之间数据已完全一致,在实际操作中,如果主库的实例不支持脱机备 份那可以进入disql工具中执行如下指令进行联机备份:

SQL>BACKUP DATABASE BACKUPSET '/dm8/back/BACK_FILE_1';

配置主库

dm.ini

##实例名,建议使用“组名_守护环境_序号”的命名方式,总长度不能超过16
INSTANCE_NAME = GRP1_01
PORT_NUM = 32141                  ##数据库实例监听端口
DW_INACTIVE_INTERVAL = 60         ##接收守护进程消息超时时间
ALTER_MODE_STATUS = 0             ##不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2             ##不允许备库OFFLINE表空间
MAL_INI = 1                       ##打开MAL系统
ARCH_INI = 1                      ##打开归档配置
RLOG_SEND_APPLY_MON = 64          ##统计最近64次的日志发送信息

dmmal.ini

配置 MAL 系统,各主备库的 dmmal.ini 配置必须完全一致,MAL_HOST 使用内部网络 IP,MAL_PORT 与 dm.ini 中 PORT_NUM 使用不同的端口值,MAL_DW_PORT 是各实例对应的守护进程之间,以及守护进程和监视器之间的通信端口,配置如下:

MAL_CHECK_INTERVAL = 5 			##MAL链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5           	##判定MAL链路断开的时间
[MAL_INST1]
	MAL_INST_NAME = GRP1_01		        ##实例名,和dm.ini中的INSTANCE_NAME一致
	MAL_HOST = 192.168.44.173               ##MAL系统监听TCP连接的IP地址
	MAL_PORT = 61141			##MAL系统监听TCP连接的端口
	MAL_INST_HOST = 192.168.44.173	        ##实例的对外服务IP地址
	MAL_INST_PORT = 32141		        ##实例的对外服务端口,和dm.ini中的PORT_NUM一致
	MAL_DW_PORT = 52141 			##实例本地的守护进程监听TCP连接的端口
	MAL_INST_DW_PORT = 33141 		##实例监听守护进程TCP连接的端口
[MAL_INST2]
	MAL_INST_NAME = GRP1_02
	MAL_HOST = 192.168.44.177
	MAL_PORT = 61142
	MAL_INST_HOST = 192.168.44.177
	MAL_INST_PORT = 32142
	MAL_DW_PORT = 52142
	MAL_INST_DW_PORT = 33142

dmarch.ini

修改 dmarch.ini,配置本地归档和实时归档。
除了本地归档外,其他归档配置项中的 ARCH_DEST 表示实例是 Primary 模式时,需要同步归档数据的目标实例名。
当前实例 GRP1_01 是主库,需要向 GRP1_02(实时备库)同步数据,因此实时归档的 ARCH_DEST 配置为 GRP1_02。

[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME 				##实时归档类型
ARCH_DEST = GRP1_02 				##实时归档目标实例名

[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL 				##本地归档类型
ARCH_DEST = /dm8/arch 	                        ##本地归档文件存放路径
ARCH_FILE_SIZE = 128 				##单位Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 0				##单位Mb,0表示无限制,范围1024~2147483647M

dmwatcher.ini

修改 dmwatcher.ini 配置守护进程,配置为全局守护类型,使用自动切换模式。

[GRP1]
DW_TYPE = GLOBAL 					##全局守护类型
DW_MODE = AUTO						##自动切换模式
DW_ERROR_TIME = 10 					##远程守护进程故障认定时间
INST_RECOVER_TIME = 60 				##主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 				##本地实例故障认定时间
INST_OGUID = 123456 				##守护系统唯一OGUID值
INST_INI = /dm8/data/zhubei/dm.ini 	        ##dm.ini配置文件路径
INST_AUTO_RESTART = 1 				##打开实例的自动启动功能
INST_STARTUP_CMD = /dm8/bin/dmserver	##命令行方式启动
RLOG_SEND_THRESHOLD = 0 			##指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 			##指定备库重演日志的时间阈值,默认关闭

启动主库

以 Mount 方式启动主库

./dmserver /dm8/data/zhubei/dm.ini mount

注意:一定要以Mount方式启动数据库实例,否则系统启动时会重构回滚表空间,生成Redo日志;并且,启动后应用可能连接到数据库实例进行操作,破坏主备库的数据一致性。数据守护配置结束后,守护进程会自动Open数据库。

设置 OGUID

启动命令行工具 DIsql,登录主库设置 OGUID 值。

SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(123456);
SQL>alter database primary;
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

注意:系统通过OGUID值确定一个守护进程组,由用户保证OGUID值的唯一性,并确保数据守护系统中,数据库、守护进程和监视器配置相同的OGUID值。

配置备库

dm.ini

##实例名,建议使用“组名_守护环境_序号”的命名方式,总长度不能超过16
INSTANCE_NAME = GRP1_02
PORT_NUM = 32142 				##数据库实例监听端口
DW_INACTIVE_INTERVAL = 60		##接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 			##不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 			##不允许备库OFFLINE表空间
MAL_INI = 1 					##打开MAL系统
ARCH_INI = 1					##打开归档配置
RLOG_SEND_APPLY_MON = 64		##统计最近64次的日志重演信息

dmarch.ini

修改 dmarch.ini,配置本地归档和实时归档。
除了本地归档外,其他归档配置项中的 ARCH_DEST 表示实例是 Primary 模式时,需要同步归档数据的目标实例名。
当前实例 GRP1_02 是备库,守护系统配置完成后,可能在各种故障处理中,GRP1_02 切换为新的主库,正常情况下,GRP1_01 会切换为新的备库,需要向 GRP1_01 同步数据,因此实时归档的 ARCH_DEST 配置为 GRP1_01。

[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME 				##实时归档类型
ARCH_DEST = GRP1_01 				##实时归档目标实例名

[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL 					##本地归档类型
ARCH_DEST = /dm8/arch 	##本地归档文件存放路径
ARCH_FILE_SIZE = 128 				##单位Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 0				##单位Mb,0表示无限制,范围1024~2147483647M

其他配置文件内容与主库相同。

启动备库

以 Mount 方式启动备库。

./dmserver /dm8/data/zhubei/dm.ini mount

设置 OGUID

SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(123456);
SQL>alter database standby;
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

配置监视器

配置监视器时可以选择配置单实例监视器或配置多实例监视器,由于主库和实时备库的守护进程配置为自动切换模式,因此这里选择配置确认监视器。和普通监视器相比,确认监视器除了相同的命令支持外,在主库发生故障时,能够自动通知实时备库接管为新的主库,具有自动故障处理的功能。

注意:故障自动切换模式下,必须配置确认监视器,且确认监视器最多只能配置一个。

修改dmmonitor.ini

配置确认监视器,其中 MON_DW_IP 中的 IP 和 PORT 和 dmmal.ini 中的 MAL_HOST 和 MAL_DW_PORT 配置项保持一致。

MON_DW_CONFIRM = 1 		##确认监视器模式
MON_LOG_PATH = /dm8/data/log    ##监视器日志文件存放路径
MON_LOG_INTERVAL = 60 		##每隔60s定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 32 		##每个日志文件最大32M
MON_LOG_SPACE_LIMIT = 0 	##不限定日志文件总占用空间
[GRP1]
	MON_INST_OGUID = 123456 ##组GRP1的唯一OGUID值
##以下配置为监视器到组GRP1的守护进程的连接信息,以“IP:PORT”的形式配置
##IP对应dmmal.ini中的MAL_HOST,PORT对应dmmal.ini中的MAL_DW_PORT
	MON_DW_IP = 192.168.44.173:52141
	MON_DW_IP = 192.168.44.177:52142

启动数据守护进程

./dmwatcher /dm8/data/zhubei/dmwatcher.ini
./dmwatcher /dm8/data/zhubei/dmwatcher.ini

启动监视器进程

 ./dmmonitor /dm8/data/DMDW/dmmonitor.ini

注册服务

./dm_service_installer.sh -t dmserver -dm_ini /dm8/data/zhubei/dm.ini -p GRP1_01
./dm_service_installer.sh -t dmwatcher  -watcher_ini /dm8/data/zhubei/dmwatcher.ini -p GRP1_01
./dm_service_installer.sh -t dmmonitor  -monitor_ini /dm8/data/DMDW/dmmonitor.ini -p GRP1

检查状态

在守护进程前台启动之后输入show命令可以查看当前状态
在监视器前台启动之后入输入show命令可以查看集群状态

故障排查

出现问题:在监视器中显示没有活动实例或者监视器还未收到守护进程消息
原因:无法与主库、备库通信,防火墙没有关闭
关闭防火墙即可:

systemctl stop firewalld.service      ##关闭防火墙
systemctl disable firewalld.service   ##开机禁用防火墙

测试实时主备数据同步

查看主库:

create table test(id int);
commit;
insert into test values(1);
commit;
select * from test;

查看备库

select * from test;
posted @ 2022-10-10 10:49  tazimi  阅读(235)  评论(0编辑  收藏  举报