灾备
1. 灾备
什么是灾备?
灾备是容灾和备份的简称。 灾备方案=容灾方案+备份方案
- 容灾: 将一套系统部署在不同的可用区【同城或者异地】,互相之间可以进行健康状态监视和高可用切换,当一个可用区出现异常停止工作时,整个应用系统可以切换到另一处,不影响功能的正常使用。侧重数据同步和系统持续可用。
- 备份:指将应用系统产生的重要数据制作一份或多分拷贝文件,增加数据的安全。侧重数据的备份和保存。
灾备的关键指标:
- RTO-恢复时间目标:指在系统出现宕机到恢复业务服务的时间,RTO越低说明系统的恢复能力越高,相对的成本也要更大。
- RPO-恢复点目标:指灾难出现后,系统进行数据恢复,恢复得来的数据对应时间点称为RPO,反映数据丢失量,RPO越小说明企业允许丢失的数据越少。比如 “RPO = 1 天” 意味着恢复时使用一天前的数据,那么一天之内的数据就丢失了。
备份的分类
- 备份内容
- 操作系统备份
- 数据备份
- 备份数据量
- 全量备份:备份所有数据
- 增量备份:根据上一次备份所作的增量备份(在上一次备份的基础上备份)
- 差异备份:根据上一次全量备份所作的差异备份(差异备份只对比上一次全量)
- 备份的形式
- 物理备份:备份真实数据
- 逻辑备份:备份操作记录
- 备份时是否需要停服务
- 冷备份:将数据以隔离的方式进行保存,不受原数据影响,数据恢复慢,解决人为误操作。
- 热备份:搭建冗余环境,恢复速度快,不能解决人为误操作。
2. 高可用(HA)
高可用的实现形式
- Active/Passive HA:集群只包括两个节点简称主备。在这种配置下,系统采用主和备用机器来提供服务,系统只在主设备上提供服务。在主设备故障时,备设备上的服务被启动来替代主设备提供的服务。典型地,可以采用 CRM 软件比如 Pacemaker 来控制主备设备之间的切换,并提供一个虚机 IP 来提供服务。
- Active/Active HA:集群只包括两个节点时简称双主,包括多节点时成为多主(Multi-master)。在这种配置下,系统在集群内所有服务器上运行同样的负载。以数据库为例,对一个实例的更新,会被同步到所有实例上。这种配置下往往采用负载均衡软件比如 HAProxy 来提供服务的虚拟 IP。