详解如何在数仓中搭建细粒度容灾应用

合集 - 数据库(100)

1.数仓实践丨主动预防-DWS关键工具安装确认2023-04-25 2.一条SQL如何被MySQL架构中的各个组件操作执行的？2023-05-04 3.GaussDB(DWS)网络流控与管控效果2023-05-05 4.GaussDB(DWS)字符串处理函数返回错误结果集排查2023-05-06 5.从缓存的本质说起，说服技术大佬用Redis2023-05-10 6.这年头怕数据泄露？全密态数据库：无所谓，我会出手2023-05-19 7.华为云新一代分布式数据库GaussDB，给世界一个更优选择2023-06-09 8.GaussDB技术解读丨高级压缩2023-07-19 9.掌数科技携手华为云GaussDB，助力金融科技创新，联合打造行业标杆2023-07-20 10.一文带你全面了解openGemini2023-07-25 11.GaussDB(for Redis)多租户：读写权限控制和数据库隔离的完美融合2023-07-26 12.5分钟迁移关系型数据库到图数据库2023-07-26 13.数仓现网案例丨超大结果集接收异常2023-07-27 14.DWS轻量化更新黑科技：宽表加工优化2023-07-28 15.数据库行业需要什么样的人才？高校老师这样说2023-07-31 16.数仓性能优化：倾斜优化-表达式计算倾斜的hint优化2023-08-01 17.GaussDB技术解读系列之SQL Audit，面向应用开发的SQL审核工具2023-08-02 18.带你认识数仓的监控系统TopSQL2023-08-04 19.带你走进数仓大集群内幕丨详解关于作业hang及残留问题定位2023-08-07 20.实时入库不用愁，HStore帮分忧2023-08-08 21.openGauss数据库在CentOS上的安装实践2023-08-10 22.揭秘华为云GaussDB(for Redis)丨大key治理2023-08-11 23.GaussDB(DWS)函数不同写法引发的结果差异2023-08-11 24.数仓中典型的几种不下推语句整改案例2023-08-14 25.GaussDB技术解读系列之应用无损透明（ALT）2023-08-14 26.华为云GaussDB(for Influx)单机版上线，企业降本增效利器来了2023-08-15 27.数仓备份经验分享丨详解roach备份原理及问题处理套路2023-08-16 28.中国云数据仓库，双第一！2023-08-21 29.华为云GaussDB打造最可信的数据库，给世界一个更优选择2023-08-22 30.GaussDB技术解读系列：高级压缩之OLTP表压缩2023-08-23 31.十年磨一剑的华为云GES，高明在哪2023-08-25 32.使用DWS集群，用户被锁定如何解锁2023-08-25 33.GaussDB技术解读系列：高安全之密态等值2023-08-28 34.GaussDB技术解读：应用无损透明（ALT）2023-08-30 35.数仓资源管控理论已掌握，是时候实战了2023-09-04 36.row_number函数的不稳定性2023-09-05 37.GaussDB技术解读丨数据库迁移创新实践2023-09-07 38.聊聊GaussDB AP是如何执行SQL的2023-09-07 39.Navicat 携手华为云GaussDB，联合打造便捷高效的数据库开发和建模工具方案2023-09-11 40.GaussDB技术解读系列丨运维自动驾驶探索2023-09-12 41.一次性全讲透GaussDB（DWS）锁的问题2023-09-13 42.GaussDB(DWS)性能调优：Sort+Groupagg聚集引起的性能瓶颈案例2023-09-14 43.多主架构：VLDB技术论文《Taurus MM: bringing multi-master to the cloud》解读2023-09-14 44.GaussDB（for Redis）游戏实践：玩家下线行为上报2023-09-18 45.一文详解数据仓库的物理细粒度备份恢复2023-09-18 46.华为云HBase冷热分离最佳实践2023-09-25 47.四问复合索引，让你的数据查询速度飞起2023-09-27 48.GaussDB(DWS)案例丨MERGE场景下语句不下推引起的性能瓶颈问题2023-10-07 49.如何强制SQL走性能更优的hash join2023-10-13 50.如何使用GaussDB(DWS)的本地临时表进行数据处理2023-10-17 51.华为云GaussDB亮相金融业数据库技术大会2023-10-18 52.2个数仓中不等值关联优化案例2023-10-19 53.数仓实时场景下表行数估算不准确引起的的性能瓶颈问题案例2023-10-24 54.详解GuassDB数据库权限命令：GRANT和REVOKE2023-10-26 55.DWS临时内存不可用报错: memory temporarily unavailable2023-10-27 56.华为云GaussDB城市沙龙活动走进安徽，助力金融行业数字化转型2023-10-31 57.理论+应用，带你了解数据库资源池2023-11-02 58.人人用数不用愁，动态数据脱敏为您解忧2023-11-03 59.实例讲解数据库的数据去重2023-11-07 60.数仓实践丨表扫描时过滤行数过多引起的性能瓶颈问题2023-11-08 61.实例详解构建数仓中的行列转换2023-11-08 62.Proxy下的Prepare透传，让GaussDB(for MySQL)更稳固，性能更卓越2023-11-09 63.浅析KV存储之长尾时延解决办法2023-11-10 64.实例讲解数据库的定义重载函数2023-11-15 65.详解数据库SQL中的三个语句：DROP、TRUNCATE 、DELETE2023-11-16 66.华为云GaussDB助力工商银行、华夏银行斩获“十佳卓越实践奖”2023-11-17 67.Navicat 基于 GaussDB 主备版的快速入门2023-11-20 68.数仓实时算子难以观测，快来试试算子级监控吧2023-11-21 69.列举数据库缓存使用场景实例和命令速查表2023-11-24 70.带你认识多模数据库GeminiDB架构与应用实践2023-11-27 71.3招解决时序数据高基数难题，性能多维度提升！2023-11-27 72.数仓性能调优：row_number() over(p)-rn=1性能瓶颈发现和改写套路2023-11-28 73.数仓实践丨常量标量子查询做全连接导致整体慢2023-11-30 74.细说GaussDB(DWS)的2种查询优化技术2023-12-04 75.细说SQL与ETL之间的小秘密2023-12-06 76.从概念到实践，带你掌握层次递归查询2023-12-08 77.GeminiDB Cassandra接口新特性PITR发布：支持任意时间点恢复2023-12-11 78.你的JoinHint为什么不生效2023-12-18 79.六步走向无忧，华为云数据库高可用的秘密武器2023-12-22 80.数仓调优实践丨SQL改写消除相关子查询2023-12-25 81.GaussDB(for MySQL)新特性TDE发布：支持透明数据加密2024-01-08 82.详解GaussDB(DWS)通信安全的小妙招：连接认证机制2024-01-10 83.GaussDB(for MySQL) RegionlessDB发布：全球数据库技术2024-01-12 84.5分钟带您了解DRS录制回放2024-01-15 85.ICDM'23 BICE论文解读：基于双向LSTM和集成学习的模型框架2024-01-19 86.数仓如何递归查询视图依赖2024-01-24 87.支撑核心系统分布式改造，GaussDB为江南农商银行筑稳根基2024-01-25 88.近6成金融机构的选择！华为云GaussDB加快金融核心系统转型2024-01-25 89.GaussDB(for MySQL)剪枝功能，让查询性能提升70倍！2024-01-29 90.2023年度十佳课题公布：华为云GaussDB获权威认可2024-01-30

91.详解如何在数仓中搭建细粒度容灾应用2024-02-01

92.对话苏光牛：国内数据库市场已进入关键转折点，2024年或是分水岭2024-02-06 93.GaussDB通信运维：详解stream连接池设计原理2024-02-19 94.GaussDB(for MySQL) Serverless全面商用：无感弹性，极致性价比2024-02-19 95.华为云GaussDB支撑农行超级网银业务，性能和稳定性备受认可2024-02-22 96.实例详解数据库的游标管理2024-02-26 97.数仓实践丨从CU入手优化HStore表2024-02-27 98.数仓的等待视图中，为什么会有Hashjoin-nestloop2024-02-28 99.如何基于Sharding-JDBC实现GaussDB在客户端应用的读写分离01-20 100.如何迅速并识别处理MDL锁阻塞问题01-22

本文分享自华为云社区《GaussDB(DWS)细粒度容灾使用介绍》，作者：天蓝蓝。

1. 前言

适用版本：【8.2.1.210及以上】

当前数仓承载的客户业务越来越多，从而导致客户对于数仓的可靠性要求不断增加。尤其在金融领域，容灾备份机制是信息系统必须提供的能力之一。本文介绍了在云上环境的双集群(不跨Region不跨VPC)后台手动部署并使用细粒度容灾的主要步骤，使得用户能快速方便得搭建起细粒度容灾。

2. 细粒度容灾简介

对于MPPDB集群的容灾而言，目前业界的常见方案要么是部署两套规格配置同等的集群，要么通过逻辑双加载方式去实现，这两个方案缺点比较明显，存在架构复杂、建设成本高等问题，不仅使得灾备部署难度增大，还导致资源浪费。在此背景下，GaussDB(DWS)基于列存表实现细粒度容灾能力，既满足核心分析型业务在极端场景的业务连续性要求，同时也能大幅降低容灾方案的建设成本，而且容灾架构轻量化，容灾系统易运维、易操作、易演练，从而帮助用户迅捷、经济、按需构建核心业务的容灾系统。

相比于传统的容灾方案，细粒度容灾有以下优势：

主集群和备集群双活（Active-Active）（备集群除灾备表只读外，其余表可读写）
主备集群只需满足DN整数倍关系，降低备集群建设资源，方便灵活部署
利用列存表的数据和元数据分离的特点，通过元数据逻辑同步 + 数据物理同步的方式，同步增量，结合UDF的增量抽取/回放接口，保障表级数据一致性
粒度可控，支持表级、schema级、库级容灾
支持表DDL，部分DCL元数据同步，达到切换可用

细粒度容灾示意图

3. 容灾前准备

3.1 配置互信

前提条件

确保ssh服务打开。
确保ssh端口不会被防火墙关闭。
确保所有机器节点间网络畅通。

配置互信

依次登录主备集群各节点沙箱外，执行步骤2-4。

将主集群和备集群所有节点ip和hostname添加到/home/Ruby/.ssh/authorized_keys和/var/chroot/home/Ruby/.ssh/authorized_keys的from列表中。

将主集群和备集群所有节点ip和hostname的映射添加到/etc/hosts和/var/chroot/etc/hosts文件中。

遍历主集群和备集群所有节点ip和hostname，执行以下命令。

ssh-keyscan -t rsa -T 120 ${ip/hostname} >> /home/Ruby/.ssh/known_hosts
ssh-keyscan -t rsa -T 120 ${ip/hostname} >> /var/chroot/home/Ruby/.ssh/known_hosts

校验互信

从主集群任一节点能免密ssh到备集群任一节点且从备集群任一节点能免密ssh到主集群任一节点，即代表互信已配置成功。

3.2 配置容灾配置文件

Ruby用户分别登录主备集群主节点沙箱内。
创建容灾目录，假设目录为/DWS/data2/finedisaster。mkdir -p /DWS/data2/finedisaster
在/DWS/data2/finedisaster目录下，创建容灾配置文件backupRestore.ini和主备集群倒换配置文件sw_backupRestore.ini。

注意：

细粒度容灾的容灾备份过程支持与物理细粒度备份业务并行执行。可通过以下措施隔离：

两个备份任务指定不同的metadata目录和media目录，实现备份数据隔离。容灾备份目录通过容灾配置文件(backupRestore.ini和sw_backupRestore.ini)中的参数primary-media-destination和primary-metadata-destination指定。

细粒度容灾的容灾备份端口与物理细粒度备份的master-port指定为不同的值，实现备份进程端口的隔离。容灾的备份端口通过容灾配置文件(backupRestore.ini和sw_backupRestore.ini)中的参数backup-port指定。

容灾配置文件backupRestore.ini

以下是backupRestore.ini文件示例，可根据具体业务场景修改配置参数值。

# Configuration file for SyncDataToStby tool
# The backup life cycle
life-cycle=10m
# The table that records backups info
backuprestoreinfo-file=backuprestoreinfo.csv
# The cluster user name for cluster
username=Ruby
# The primary cluster env set
primary-env=
# The standby cluster env set
standby-env=
# Time interval between each full backup, uint: min
full-backup-exec-time-interval=N/A
# Time interval between each backup
backup-exec-time-interval=2
# One of the backup hosts
primary-host-ip=XXX.XXX.XXX.XX
# The media type that restore backup files, DISK
media-type=disk
# The number of process that should be used. Range is (1~32)
parrallel-process=4
# The compression level that should be used for backup. Range(0~9)
compression-level=1
compression-type=2
# Media destination where the backup must be stored
primary-media-destination=/DWS/data2/finedisaster/mediadata
# Metadata destination where the metadata must be stored
primary-metadata-destination=/DWS/data2/finedisaster/metadata
# The master-port in which the backup must be executed
backup-port=XXXX
# Logging level for the log contents of backup:FATAL,ERROR,INFO,DEBUG
primary-cluster-logging-level=INFO
# Time interval between each restore, uint: min
restore-interval=2
# One of the restore hosts
restore-host-ip=XXX.XXX.XXX.XX
# Media destination where the backup contents must be stored in the standby cluster
restore-media-destination=/DWS/data2/finedisaster/mediadata
# Metadata destination where the backup contents must be stored in the standby cluster
restore-metadata-destination=/DWS/data2/finedisaster/metadata
# The master-port in which the restore must be executed
restore-port=XXXX
# Logging level for the log contents of restore
standby-cluster-logging-level=INFO
# The maximum number of log files that should be created. Range is (5~1024).
log-file-count=50
# The retry times of checking cluster balance for resuem backup or double clusters
check-balance-retry-times=0
# cluster id
primary-cluster-id=11111111-1111-1111-1111-111111111111
standby-cluster-id=22222222-2222-2222-2222-222222222222
# Processes tables for which fine-grained disaster recovery is no longer performed
# Value should be 'none', 'log-desync-table', 'drop-desync-table'
desync-table-operation=drop-desync-table
# Number of CPU cores that can be used by each DR process. Range is (1~1024).
cpu-cores=8
# The max number of rch files that can be reserved on master cluster before sent to standby cluster. 0 means no limit.
local-reserve-file-count=160

主备集群倒换配置文件sw_backupRestore.ini相比于backupRestore.ini只需颠倒下列参数

primary-host-ip / restore-host-ip
backup-port / restore-port
primary-media-destination / restore-media-destination
primary-metadata-destination / restore-metadata-destination
primary-cluster-id / standby-cluster-id

配置文件主要参数说明

参数名	参数含义
username	执行双集群脚本的OS用户，设置成GaussDB(DWS)集群相同的OS用户
primary-env	主集群的环境变量存储文件的绝对路径
standby-env	备集群的环境变量存储文件的绝对路径
backup-exec-time-interval	增量备份周期
primary-host-ip	主集群执行备份的节点ip
compression-type	备份文件的压缩算法类型
compression-level	备份文件的压缩级别
primary-media-destination	主集群上存放备份文件的绝对路径
primary-metadata-destination	主集群上备份元数据的绝对路径
backup-port	Roach主代理备份进程的执行端口
restore-interval	恢复周期
restore-host-ip	备集群执行恢复的节点ip
restore-media-destination	备集群存放主集群同步的备份文件的路径
restore-metadata-destination	备集群存放主集群同步的元数据信息的路径
restore-port	恢复进程执行端口
primary-cluster-id	指定主集群的UUID
standby-cluster-id	指定备集群的UUID
new-disaster-recovery-suppressed-time-windows	指定主集群不发起新一轮备份的时间窗口
desync-table-operation	指定不再进行细粒度容灾的表，在备集群上的处理方式
cpu-cores	指定容灾每个进程能使用的cpu核数
local-reserve-file-count	在发送到备用群集之前，可以在主群集上保留的最大rch文件数。0表示无限制。

3.3 主备集群准备

Ruby用户登录主集群主节点沙箱内。

设置集群GUC参数。

local-dn-num为本集群DN数，remote-dn-num为对方集群DN数，可替换为实际值。

python3 $GPHOME/script/DisasterFineGrained.py -t prepare --local-dn-num 6 --remote-dn-num 3 --config-file /DWS/data2/finedisaster/backupRestore.ini

3.4 容灾表数据准备

主集群连接数据库，准备容灾表数据。

新建容灾表

create table schema1.table_1(id int, name text) with (orientation = column, colversion="2.0", enable_disaster_cstore="on", enable_delta=false) DISTRIBUTE BY hash(id);

存量表(非容灾表)转为容灾表

alter table schema1.table_1 set (enable_disaster_cstore='on');
--查询表的分布方式
select pclocatortype from pg_catalog.pgxc_class where pcrelid = 'schema1.table_1'::regclass::oid limit 1;
--若表的分布方式为H（HASH分布），获取一个hash表的分布列，后续以'id'列分布为例
select pg_catalog.getdistributekey('schema1.table_1');
--对表做重分布
alter table schema1.table_1 DISTRIBUTE BY HASH(id);
--若表的分布方式为N(ROUNDROBIN分布)，对表做重分布
alter table schema1.table_1 DISTRIBUTE BY ROUNDROBIN;
--若表的分布方式为R(REPLICATION分布)，对表做重分布
alter table schema1.table_1 DISTRIBUTE BY REPLICATION;

4. 细粒度容灾操作

4.1 定义发布

Ruby用户登录主集群主节点沙箱，以下操作均在沙箱内进行。

连接数据库，通过发布语法指定需要容灾的主表，语法如下：

--发布所有表
CREATE PUBLICATION _pub_for_fine_dr FOR ALL TABLES;
--发布schema
CREATE PUBLICATION _pub_for_fine_dr FOR ALL TABLES IN SCHEMA schema1, schema2;
--发布表和schema
CREATE PUBLICATION _pub_for_fine_dr FOR ALL TABLES IN SCHEMA schema1, TABLE schema2.table_1;
--增加一个发布表
ALTER PUBLICATION _pub_for_fine_dr ADD TABLE schema1.table_1;
--增加发布SCHEMA
ALTER PUBLICATION _pub_for_fine_dr ADD ALL TABLES IN SCHEMA schema2;

定义发布后，将容灾publication放到参数文件中，以dbname.pubname形式，例如：

echo 'dbname._pub_for_fine_dr' > /DWS/data2/finedisaster/pub.list

若需要解除发布，通过DisasterFineGrained.py脚本下发cancel-publication命令

# 1、创建需要取消的容灾对象列表文件
# 解除发布表
echo 'db_name.schema_name.table_name' > /DWS/data2/finedisaster/config/disaster_object_list.txt
# 解除发布SCHEMA
echo 'db_name.schema_name' > /DWS/data2/finedisaster/config/disaster_object_list.txt

# 2、下发cancel-publication命令
python3 $GPHOME/script/DisasterFineGrained.py -t cancel-publication --disaster-object-list-file /DWS/data2/finedisaster/config/disaster_object_list.txt --config-file /DWS/data2/finedisaster/backupRestore.ini

# 3、取消全部发布
python3 $GPHOME/script/DisasterFineGrained.py -t cancel-publication --config-file /DWS/data2/finedisaster/backupRestore.ini --all-cancel

4.2 启动容灾

注意：

云上集群沙箱内无法启动crontab任务，需要在主备集群沙箱外手动添加定时备份恢复任务

HCS 8.3.0及以上环境，沙箱外crontab设置ssh到沙箱内的定时任务，为了防止沙箱逃逸，ssh前需要加上"sudo python3 /rds/datastore/dws/XXXXXX/sudo_lib/checkBashrcFile.py && source /etc/profile && source ~/.bashrc && "，否则定时任务不生效。checkBashrcFile.py文件路径与版本号有关。

主集群主节点沙箱外设置定时任务，crontab -e。注意替换主节点IP。

*/1 * * * * nohup ssh XXX.XXX.XXX.XXX "source /etc/profile;if [ -f ~/.profile ];then source ~/.profile;fi;source ~/.bashrc;nohup python3 /opt/dws/tools/script/SyncDataToStby.py -t backup  --config-file /DWS/data2/finedisaster/backupRestore.ini --disaster-fine-grained --publication-list /DWS/data2/finedisaster/pub.list  >>/dev/null 2>&1 &"  >>/dev/null 2>&1 &

备集群主节点沙箱外设置定时任务，crontab -e。注意替换主节点IP。

*/1 * * * * nohup ssh XXX.XXX.XXX.XXX "source /etc/profile;if [ -f ~/.profile ];then source ~/.profile;fi;source ~/.bashrc;nohup python3 /opt/dws/tools/script/SyncDataToStby.py -t restore  --config-file /DWS/data2/finedisaster/backupRestore.ini  --disaster-fine-grained  >>/dev/null 2>&1 &" >>/dev/null 2>&1 &

成功启动备份确认。

Ruby用户分别登录主备集群主节点沙箱，查询SyncDataToStby.py进程是否存在。

ps ux | grep SyncDataToStby | grep -v grep

Ruby用户登录主/备集群主节点沙箱，使用roach的show-progress监控工具，查看备份/恢复进度。show-progress命令提供主备集群备份恢复进度等信息，显示结果为json格式，各字段含义请参考产品文档。

python3 $GPHOME/script/SyncDataToStby.py -t show-progress --config-file /DWS/data2/finedisaster/backupRestore.ini

系统回显：

{
  "primary cluster": {
    "key": "20231109_212030",
    "priorKey": "20231109_211754",
    "actionType": "Backup",
    "progress": "100.00%",
    "backupRate": {
      "producerRate": "0MB/s",
      "compressRate": "0MB/s",
      "consumerRate": "0MB/s"
    },
    "currentStep": "FINISH",
    "unrestoreKeys": "N/A",
    "failedStep": "INIT",
    "errorMsg": "",
    "errorCode": "",
    "actionStartTime": "2023-11-09 21:20:28",
    "actionEndTime": "2023-11-09 21:20:49",
    "updateTime": "2023-11-09 21:20:50"
  },
  "standby cluster": {
    "key": "20231109_175002",
    "priorKey": "N/A",
    "actionType": "Restore",
    "progress": "100.00%",
    "backupRate": {
      "producerRate": "0MB/s",
      "compressRate": "0MB/s",
      "consumerRate": "0MB/s"
    },
    "currentStep": "FINISH",
    "unrestoreKeys": "20231109_211754,20231109_212030",
    "failedStep": "INIT",
    "errorMsg": "",
    "errorCode": "",
    "actionStartTime": "2023-11-09 17:53:07",
    "actionEndTime": "2023-11-09 17:53:15",
    "updateTime": "2023-11-09 17:53:15"
  },
  "apply": {
    "backupState": "waiting",
    "restoreState": "waiting",
    "backupSuccessTime": "2023-11-09 21:21:24",
    "restoreSuccessTime": "2023-11-09 17:53:55"
  },
  "latestBarrierTime": "",
  "recovery point objective": "3:32:17",
  "failover recovery point time": ""
}

show-progress命令显示的主要字段释义如下

priorKey：该备份集是基于这个backup key生成的。
actionType：备份集当前的操作类型。
取值包括如下：
- Backup，表示备份阶段。
- Restore，表示恢复阶段。
progress：备份或恢复操作的进度。
currentStep：备份或恢复正在执行的步骤。
unrestoreKeys：待恢复的key列表。
failedStep：备份或恢复失败的步骤，初始值默认为INIT。
errorMsg：备份或恢复失败的错误信息，如果成功，该字段则显示成功的信息。
errorCode：备份或恢复的错误码，该字段为预留字段，暂未使用。
actionStartTime：当前操作的开始时间。
actionEndTime：当前操作的结束时间。
updateTime：当前操作进度的刷新时间。
backupState：当前备份状态（backuping/stopped/waiting/abnormal）。
restoreState：当前恢复状态（restoring/stopped/waiting/abnormal）。
backupSuccessTime：上次成功备份结束的时间。
restoreSuccessTime：上次成功恢复结束的时间。
latestBarrierTime：上次主备集群一致点时间。
recovery point objective：rpo时间（当前主集群时间到最后一个恢复成功的备份集备份开始时间）。
failover recovery point time：failover未同步时间点。

4.3 结果验证

4.3.1 功能验证

同步前后进行数据一致性校验，主表、备表数据进行checksum校验，检查是否同步正确（需排除由于接入业务导致的差异）。

4.3.2 性能验证

通过show-progress监控工具可以看到最近一次备份、恢复耗时。

5. 解除容灾

5.1 停止容灾

# 主备集群取消沙箱外的定时容灾任务，在备份/恢复任务前添加注释符“#”，取消定时任务
crontab -e
# 主集群Ruby用户登录主节点沙箱，停止备份
python3 $GPHOME/script/SyncDataToStby.py -t stop-backup --config-file /DWS/data2/finedisaster/backupRestore.ini --disaster-fine-grained
# 备集群Ruby用户登录主节点沙箱，停止恢复
python3 $GPHOME/script/SyncDataToStby.py -t stop-restore --config-file /DWS/data2/finedisaster/backupRestore.ini --disaster-fine-grained

5.2 删除容灾

警告

当不再需要容灾任务的时候，可以解除主备关系，恢复备集群的读写能力。删除容灾前需要先停止容灾。

Ruby用户登录主集群主节点的沙箱内。

python3 $GPHOME/script/SyncDataToStby.py -t set-independent --config-file /DWS/data2/finedisaster/backupRestore.ini --disaster-fine-grained

系统回显：

Delete csv file.
Delete roachbackup file from XXX.XXX.XXX.XX
Delete roachbackup file from XXX.XXX.XXX.XX
Clear cluster disaster state.

6. 总结

本文介绍了在云上环境的双集群(不跨Region不跨VPC)后台手动部署并使用细粒度容灾的主要步骤，分为容灾前准备、细粒度容灾操作和解除容灾，使得用户能快速方便得搭建起细粒度容灾。

点击关注，第一时间了解华为云新鲜技术~

posted @ 2024-02-01 09:32 华为云开发者联盟阅读(203) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 一文详解数据仓库的物理细粒度备份恢复

· 数仓备份经验分享丨详解roach备份原理及问题处理套路

· 基于 K8s 容器集群的容灾架构与方案

· 【博学谷学习记录】超强总结，用心分享。分布式缓存

· 数据中台配置中心详解一般有用看3 速一个项目流程

阅读排行：
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET：高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动！「GitHub 热点速览」
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 我与微信审核的“相爱相杀”看个人小程序副业

历史上的今天：
2023-02-01 过年回去，终于给老人讲清楚两台电脑是如何通信的
2023-02-01 城市健康云，打造大健康服务生态
2023-02-01 云小课｜手把手教您在PyCharm中连接云端资源进行代码调试
2023-02-01 代码实例解读如何安全发布对象
2021-02-01 Java之五种遍历Map集合的方式
2021-02-01 分盘存储：实现数据库备集群备份文件分散存储
2021-02-01 智能对联模型太难完成？华为云ModelArts助你实现！手把手教学

公告

昵称：华为云开发者联盟
园龄： 4年9个月
粉丝： 855
关注： 1

+加关注

2025年2月

日

一

二

三

四

五

六

详解如何在数仓中搭建细粒度容灾应用

1. 前言

2. 细粒度容灾简介

3. 容灾前准备

3.1 配置互信

3.2 配置容灾配置文件

3.3 主备集群准备

3.4 容灾表数据准备

4. 细粒度容灾操作

4.1 定义发布

4.2 启动容灾

4.3 结果验证

4.3.1 功能验证

4.3.2 性能验证

5. 解除容灾

5.1 停止容灾

5.2 删除容灾

6. 总结

公告

搜索

常用链接

我的标签

积分与排名

合集 (21)

随笔分类 (4020)

随笔档案 (4101)

阅读排行榜

评论排行榜

推荐排行榜

最新评论