私有云容灾
注意:在进行云硬盘备份时,云硬盘所属的云服务器上不能同时运行云服务器备份。也就是说,不能在云硬盘备份时进行所属云服务器备份,两者此时不能同时进行;如果不是所属的服务器此时即可同时进行云服务器备份和云硬盘备份
一、CSDR
1、定义
云服务器容灾服务(Cloud Server DR Service,以下简称CSDR)可为云服务器创建容灾,实现异地的容灾保护。(容灾内容包括云服务器的配置规格,系统盘和数据盘的数据),利用数据恢复云服务器业务数据,最大限度保障用户数据的安全性和正确性,确保业务安全。
2、场景
单机非集群云服务器,云服务器有多个云硬盘时需保证云硬盘间的数据一致性。两个数据中心,归属于两个Region,将云主机容灾到另外一个Region
3、关键技术实现:
- 生产云服务器和容灾云服务器在两个Region之间部署为主备容灾模式,数据通过存储进行远程复制,支持同步复制和异步复制。
- 支持CSDR服务实例内的多台VM的所有卷的一致性复制组。
- 支持通过容灾测试、计划性迁移、故障恢复保证业务可用性。
- 支持配置容灾管理组件eReplication在两个Region间的交叉互备。
- 关键技术规格(范围):
- 存储类型:OceanStor V3/V5/Dorado V3(暂不支持FusionStorage商用)。
- 计算类型:OpenStack+KVM/VRM。
- 网络类型:支持软SDN(级联架构)、硬SDN、无SDN。
- 关键规格:一致性组(每个CSDR实例对应一个一致性组)规格与对应存储的规格相同。如:18500/18800 V3支持512个一致性组。
5、场景与约束
- 场景:跨数据中心两个Region之间。
- 约束:
- 云服务器的云硬盘必须源自同一套生产存储;挂载同一共享盘的多个云服务器必须在同一CSDR实例中。
- CSDR仅支持跨Region的CSDR容灾,不支持在Region内容灾。
- 不支持叠加其他容灾特性,即:不支持VHA+CSDR,VHA+CSHA。
- CSDR保护粒度为云服务器,不支持云服务器内的应用管理,不支持选择云服务器部分云硬盘进行容灾保护。
- 个云服务器只可以加入一个云服务器容灾服务实例
规划阶段
•云服务器容灾服务的云硬盘仅支持小LUN方案(云服务器的一个云硬盘对应存储设备上的一个LUN)。
•仅支持跨两个Region容灾,暂不支持3个及以上Region间的互备容灾(后续版本会规划),不支持Region内两个AZ间的云服务器容灾。
•云服务器容灾服务只支持KVM+OceanStorV3/V5、DoradoV3+typeI/II/III 的资源池组合,以及VRM+OceanStor V3+type II/III 的资源组合。
•只对MangeOne运营面创建的虚拟机提供云灾备保护,不支持对MANO等其它平台创建的虚拟机进行云灾备保护。
•每个OpenStack的每个资源池内只能有一种虚拟化类型,且两套OpenStack的资源池内的虚拟化类型必须一致。
租户申请阶段:
•支持对云服务器进行容灾保护,不支持对云服务器中的应用进行容灾保护。
•申请加入到同一个云服务器容灾服务实例的多个云服务器,关联的所有云硬盘必须源自同一台生产存储上,并且在生产存储和灾备存储上配置了复制。
•挂载同一共享盘的云服务器必须在同一个CSDR服务实例中。
•不支持选择云服务器的部分云硬盘进行容灾保护。为容灾云服务器绑定新的云硬盘后,需要手工为云硬盘添加容灾保护。
•在申请容灾测试时,如果选择的测试网卡为非主网卡时,测试网卡需要在VM云服务器中配置网关IP地址,才能从其他网段访问云服务器VM。
•创建CSDR实例时,容灾虚拟机云服务器处于关闭状态。
•计划性迁移、故障恢复和重保护操作时,需容灾管理员在BCManager eReplication完成相应操作。
6、具体的应用场景
测试、清理、计划性迁移、故障恢复、重保护
二、CSBS
1、定义
云服务器备份服务(Cloud Server Backup Service,以下简称CSBS)可为云服务器创建备份(备份内容包括云服务器的配置规格,系统盘和数据盘的数据),利用备份数据恢复云服务器业务数据,最大限度保障用户数据的安全性和正确性,确保业务安全。
2、场景
单机非集群云服务器,云服务器有多个云硬盘时需保证云硬盘间的数据备份一致性。
- 单AZ单数据中心,归属于一个Region,本地备份和本地恢复
- 多个AZ多数据中心,归属于一个Region,两级备份(本地备份后再将备份数据复制到另一个数据中心),本地恢复和跨数据中心恢复
- 在线备份快速恢复,利用备份复制云服务器,批量部署
3、方案组件
ManageOne SC:向用户提供统一的云备份自助管理平台,用户按需申请备份服务;
CSBS-VBS Console:提供CSBS服务控制台;
Karbor:CSBS备份服务编排,负责保存和调度备份策略,提供对接云管理平台的API接口;
BCManager eBackup:备份管理软件,Manager&Workflow负责备份、恢复执行流程控制,Server&Proxy负责数据的存取;
FusionSphere OpenStack:提供备份、恢复等API接口。
4、部署原则
CSBS-VBS Console |
4 2节点虚拟化高可靠部署 |
Karbor |
4 3节点虚拟化高可靠部署 |
BCManager eBackup |
4 控制节点Manager&Workflow:2节点虚拟化高可靠部署 |
4 备份节点Server&Proxy:建议至少2节点物理部署(最多可扩展到64个) |
|
备份存储 |
4 FusionStorage 6.2 File/Object 4 OceanStor 9000 NAS/S3 4 OceanStor V3/V5融合存储 NAS |
生产存储 |
4 OceanStor V3/V5融合存储 SAN 4 Dorado V3 4 FusionStorage 6.2 Block |
5、约束
l 需采用小LUN方案(云服务器的一个云硬盘对应存储设备上面的一个LUN);
l 一个云服务器只可加入一个CSBS备份服务实例;
l 申请备份的云服务器的多个云硬盘需要在同一生产存储上,不支持备份云硬盘在不同生产存储上的云服务器;
l 不支持备份带有共享卷(一个云硬盘被多个云服务器共享访问)的云服务器;
l 不支持部分云硬盘的备份和恢复
l 支持硬盘数据崩溃一致性备份,不支持应用一致性备份;
l 提供针对单个云服务器的备份服务,不支持多个云服务器的一致性备份;
l 支持整机级备份与恢复,不支持只选择备份、恢复云服务器的部分云硬盘,不支持文件或目录级恢复;
l 同region内,支持不同AZ间的复制与恢复;不同region间,仅支持跨region的复制和本地恢复,不支持跨region的恢复;
l 备份过程中创建的卷快照会消耗存储空间(卷快照所占容量=快照保留期间原卷业务数据变化量)。
l 仅在硬件SDN/无SDN Region下支持OpenStack异构VMware虚拟机的备份,不支持hicloud异构VMware的虚拟机备份。
l 支持备份申请了容灾服务的云服务器,有如下约束:
1、支持备份申请了CSDR服务的云服务器:
1)不支持备份占位虚拟机;
2)云服务器故障切换后(生产端存储故障),原云服务器备份和恢复会失败;切换后新云服务器需要重新添加备份后才支持备份;
3)云服务器计划性迁移后,原云服务器的备份和恢复会失败,迁移后新云服务器需要重新添加备份后才支持备份。回切后,原云服务器的备份和恢复正常;
4)无容灾服务的VM副本,不能恢复到有容灾服务的VM;有容灾服务的VM副本,不能恢复到其他有容灾服务的VM。
2、 支持备份申请了CSHA服务的云服务器:
1)不支持备份占位虚拟机;
2)如果生产云服务器本端的生产存储发生故障,其云服务器备份会失败;
3)如果发生故障且高可用未重保护前,不支持恢复到高可用云服务器。
4)无容灾服务的VM副本,不能恢复到有容灾服务的VM;有容灾服务的VM副本,不能恢复到其他有容灾服务的VM。
3、支持备份申请了VHA服务的云服务器:
1)主云硬盘故障(云硬盘依然可恢复)时,虚机备份和备份恢复均失败。云硬盘故障恢复后,云服务器备份和备份恢复均成功。
2)主存储故障需重建修复情况下,原有备份副本恢复到原云服务器失败,支持恢复到新云服务器;云服务器备份失败,需执行在线换卷,依然可使用原有云服务器备份策略,换卷后的首次云服务器备份会进行全量备份,原有备份副本支持恢复到换卷后的云服务器。
6、关键技术
- 增量备份
- 增量恢复
- 重复数据删除
三、CSHA
1、定义
云服务器高可用服务(Cloud Server High Availability)为云服务器提供同城数据中心间的高可用保护。当生产中心发生灾难时,被保护的云服务器能够自动或手动切换到灾备中心。CSHA只提供云服务器的容灾能力,应用层的容灾需应用自己实现。
2、场景
- 生产中心发生灾难(生产中心停电、火灾等):可对受CSHA服务保护的生产云服务器自动或手工切换到灾备中心,快速启动容灾云服务器。
- 计划内停机(计划性停电、日常运维等):容灾管理员可对受CSHA服务保护的生产云服务器进行一键式的计划性迁移,在灾备中心快速启动容灾云服务器,保证业务数据零丢失;并在原生产中心完成计划性活动后,容灾管理员对受保护云服务器进行反向重保护,并在合适时间通过计划性迁移将业务切回到原生产中心。
3、架构
- 存储层:基于存储阵列的HyperMetro双活特性,在存储层提供双活LUN,同时挂载于生产或容灾云服务器中。对计算层提供多路径访问,可在单独存储层故障时自动完成双活故障切换。
- 计算层:通过将生产云服务器、容灾云服务器配置为容灾关系,并添加到保护组中,实现对生产云服务器的保护。正常情况下,仅生产云服务器工作,当需要进行故障切换时,由BCManager eReplication调用Openstack进行容灾服务器的启动操作。
- 网络层:典型部署下,生产中心网络出口、容灾中心网络出口通过不同的外部网络关联到不同的VPC上。在创建生产、容灾云服务器时,将他们分别接入生产中心VPC、容灾中心VPC。因此生产、容灾云服务器的私网IP地址,可以申请相同的IP。公网IP地址,根据网络出口的外部网络网段规划,需要配置不同的EIP地址。
- 云平台及云容灾服务层:
- CSHA服务故障切换依赖的关键组件:指在生产中心故障后,如果CSHA要将服务实例中的云服务器切换到灾备中心,所必须具备的强依赖组件。包括FusionSphere Openstack、BCManager eReplication、ManageOne IAM组件
- CSHA服务运营运维依赖的支撑组件:指的生产中心故障后,如果租户需要登录ManageOne SC、云服务器容灾服务、其他云服务界面,进行增删改查等运营操作;或由管理员登录ManageOne OC,进行运维操作所依赖的组件。包括ManageOne ServiceCenter、OperationCenter、其他IaaS基础云服务组件
- 其他高级云服务服务组件:对OBS、RDS、安全服务等高级云服务组件,当前版本暂未提供跨DC容灾部署
4、部署
BCManager eReplication |
4 CSHA Console:2节点虚拟化拉远部署 |
4 eReplication Server:2节点虚拟化拉远部署 |
|
FusionSphere Openstack |
4 一套openstack拉远部署 |
ManageOne,公共组件&基础服务 |
4 主备虚拟化部署(两个manageone) |
仲裁 |
4 存储仲裁:1节点物理化部署 |
4 仲裁云平台:1节点物理化部署 |
|
4 IAM仲裁:1节点物理化部署 |
|
存储 |
4 OceanStor V3/V5 4 Dorado V3 |
5、应用场景
- 传统单机应用或无容灾应用上云,基于IaaS层VM提供高可用
- 应用自身不支持高可用容灾,需要依赖IaaS层提供VM的高可用
- 应用无App-DB的分层结构,或分层后希望统一容灾切换
- 要求方案在站点故障时,VM可跨站点自动或手工切换启动
- 要求存储数据零丢失、存储层数据一致性
- 多个VM要求在切换过程中保证VM启动顺序
- 原有局点为Vmware HA集群跨DC或SRM多DC部署场景
- 场景规划
- 生产VM、容灾VM分别位于同一Region的不同AZ
- 生产VM、容灾VM接入不同的VPC,对应不同的DC网络出口
- 采用EIP访问时,应用需支持通过URL访问,可通过GSLB自动探测实现自动切换
- 采用专线访问时,VM访问流量需要手工切换外部网络的路由条目
- 有切换顺序、数据一致性要求的VM,添加到同一个保护组进行协同切换
6、约束
规划阶段 |
1)只能对同一个Region内2组AZ间的云服务器提供高可用服务,并且每组AZ应当位于1个独立数据中心。 2)云服务器高可用服务只支持KVM+OceanStor V3/V5、Dorado V3的资源池组合。要求两套型号相同且版本相同的存储设备组成双活。 3)自动切换模式下,CSHA服务仅支持部署在首Region。 4)云服务器高可用服务开启网卡切换模式时,不支持为SRIOV、PCI直通网卡的云服务器提供容灾保护。 5)只对MangeOne运营面创建的云服务器提供云灾备保护,不支持对MANO等其它平台创建的云服务器进行云灾备保护。 6)CSHA特性强烈建议启用网络多出口方案。因此在Region Type II组网类型下,启用网络多出口方案时,计算节点、管理节点需采用6网卡部署。 7)IMS服务需要采用Swift作为镜像存储介质。 |
租户申请阶段 |
1)支持对云服务器进行容灾保护,不支持对云服务器中的应用进行容灾保护。 2)单个云服务器或多个云服务器的云硬盘需要源于同一套存储设备,并且在生产存储和灾备存储上配置了HyperMetro. 3)挂载同一共享盘的云服务器必须在同一CSHA服务实例中。 --界面中已做了限制 4)不支持选择云服务器的部分云硬盘进行高可用保护。为高可用云服务器绑定新的云硬盘后,需要手工为云硬盘添加高可用保护。 |
管理组件高可用 |
1)仅支持ECS、EVS、VPC、CSHA服务的管理面高可用容灾。 |
特性叠加约束 |
1)VM HA叠加:CSHA场景必须开启虚拟机HA功能、管理面防脑裂开关、存储面防脑裂开关、数据盘保护开关 2)CSDR、VHA叠加:本版本不支持CSHA与CSDR、CSHA与VHA在同一项目中叠加部署。 3)CSBS叠加:CSHA实例中的云服务器,同时申请CSBS备份。在CSHA实例自动切换或手工切换后,CSBS服务不支持将备份副本恢复到原生产云服务器中。 4)VPC/ELB/EIP/专线/路由直通叠加:Type I、Type II组网类型下,CSHA保护的云服务器需要在两个VPC间切换。有互访需求的云服务器,需同时加入CSHA进行保护、切换。CSHA实例切换后云服务器的EIP会变化,如果采用路由直通/专线服务访问,需手工切换外部路由,访问IP不变。 |