eReplication详解
作者:@郑琰
本文转载请注明出处!:https://www.cnblogs.com/zhengyan6/p/16180385.html
eReplication简介
eReplication是一款基于华为存储复制、快照、双活、克隆以及FusionSphere主机复制等特性,保证上层应用数据一致性,针对华为典型容灾解决方案,提供可视化、流程化、简单、快捷的操作与监控平台的灾备管理软件。
- 本地保护
- 本地高可用
- 主备容灾
- 双活数据中心
- 两地三中心容灾
eReplication产品定位
eReplication定位为企业数据中心容灾业务管理软件,通过良好的应用感知能力,集合华为存储增值特性,确保容灾过程中应用数据的业务一致性,简单高效地完成容灾业务配置,清晰可视地掌握系统容灾业务的运行情况,快速方便地完成数据恢复和测试。
组网方式
存储层复制
使用存储设备里的特性来完成数据的复制,需要将两个存储连接到一起,可以使用IPSAN或FCSAN,然后再通过容灾管理服务器来进行业务的感知切换。
应用场景
- 生产站点和容灾站点存储设备同为华为存储,并且要有相应的容灾licence
- 保护最小单位为LUN
- 实现同步远程复制
- 被保护的为私有云场景下的虚拟机
主机层复制
虚拟冗余网关(VRG)
应用场景
- 无法使用存储层复制
- 保护的最小单位为虚拟机
- 被保护的为服务器虚拟化场景中的虚拟机
容灾用到的相关技术
IO Mirror
IO Mirror,是指通过虚拟化平台主机层进行IO捕获与复制,实现数据的远程复制和容灾管理,实现容灾保护策略制定、容灾计划制定、容灾切换(包括故障切换和计划切换)及有计划性的虚拟机迁移等。
保证了脏数据块的同步
FusionStorage不支持跨资源池的存储热迁移
远程复制
远程复制,是指基于LUN级的数据镜像,是构成容灾系统的核心。远程复制利用异地间的数据复制以及实时镜像技术,帮助用户避免因灾难性事件所带来的数据损失。
使用远程复制,对端一般是存储设备。远程复制的保护最小单位是存储里的卷(LUN),远程复制实现的就是把LUN里面所有的数据都复制给对端,分为同步复制、异步复制(都具有方向性,主——>备)
HyperMetro
基本原理
在数据中心A和数据中心B各部署一套华为OceanStor存储(通过FC/IP SAN网络连接到一起),部署为双活模式,为两数据中心业务主机同时提供读写服务。任意数据中心故障,数据零丢失
HyperMetro存储双活设计
- A-A架构:双活LUN,双站点均可读写,数据实时同步
- 高可靠性设计:双重仲裁机制,跨站点坏块修复,提高系统可靠性
- 高性能设计:提供多种性能优化手段,减少站点间交互延时,业务性能提升30%
- 灵活扩展设计:支持异构,支持与快照、远程复制联动,可扩展为两地三中心容灾方案
为了正确的判断数据中心所产生的故障,加入了第三方的仲裁设备
此设备有两种切换方式
-
静态优先级
两边优先级高的是主,低的是备。
备故障,主设备正常提供服务。
主故障,备设备不会接管业务。由于不确定是主生产中心挂了,还是主备之间的链路断了,最保险的做法就是直接停止工作 -
仲裁服务器
第三方故障域,单独询问状态
容灾中涉及的概念
站点
站点是容灾管理系统的资源组织单位,用户可在站点内或站点间配置容灾保护业务。
- 按管理位置划分,站点分为本端站点和远端站点。
- 按保护关系划分,站点分为生产站点和灾备站点。
主机和主机组
主机是指生产站点或灾备站点中的应用服务器。生产站点中的被保护主机称为生产主机,灾备站点中用于测试或容灾恢复的主机称为灾备主机。
主机组是同类主机的组合,组内主机通常为同一个型号、OS版本、业务类型和集群/HA的应用配置。
保护组
保护组是容灾管理系统进行容灾保护的业务对象,由保护对象和保护策略组成。用户可以分别为数据库、主机本地文件系统、LUN、NAS文件系统、虚拟机等各类保护对象创建保护组,根据容灾RPO/RTO要求选择不同的保护策略来实施容灾保护。
保护策略
保护策略是指容灾管理系统对保护对象进行容灾保护的保护方式与调度策略,在创建保护组时自动生成。
恢复计划
恢复计划是容灾管理系统进行容灾恢复的业务对象,用户可以对恢复计划执行测试、清理、计划性迁移、重保护、故障恢复等容灾业务操作。
VRG
VRG(Virtual Replication Gateway)的功能:
- 聚合VM的IO数据并经过压缩、加密后发送到远端站点
- 接收远端站点数据,并将数据路由发送到指定的主机上
- 提供复制策略下发、状态查询等管理接口
占位虚拟机
- 创建在容灾站点,配置、规格与被保护的虚拟机一致,一般处于关机状态
- 当容灾站点被启用时,占位虚拟机会挂载容灾站点用于和生产站点同步数据的LUN,然后启动,从而将业务拉活
配置流程
容灾测试
1,测试准备
2,启动数据复制
3,检查数据复制状态
4,创建快照副本
5,映射快照至业务主机
6,恢复业务
7,测试结束
故障恢复
1,恢复准备
2,检查数据状态
3,设备灾备存储资源可写
4,映射LUN
5,恢复业务
6,恢复结束
重保护
1,重保护准备
2,检查资源状态
3,反转存储复制方向
4,重建保护与恢复关系
5,启动数据复制
6,重保护结束
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)