灾备

1. 灾备

什么是灾备?

灾备是容灾和备份的简称。 灾备方案=容灾方案+备份方案

  • 容灾: 将一套系统部署在不同的可用区【同城或者异地】,互相之间可以进行健康状态监视和高可用切换,当一个可用区出现异常停止工作时,整个应用系统可以切换到另一处,不影响功能的正常使用。侧重数据同步和系统持续可用。
  • 备份:指将应用系统产生的重要数据制作一份或多分拷贝文件,增加数据的安全。侧重数据的备份和保存。

灾备的关键指标:

  • RTO-恢复时间目标:指在系统出现宕机到恢复业务服务的时间,RTO越低说明系统的恢复能力越高,相对的成本也要更大。
  • RPO-恢复点目标:指灾难出现后,系统进行数据恢复,恢复得来的数据对应时间点称为RPO,反映数据丢失量,RPO越小说明企业允许丢失的数据越少。比如 “RPO = 1 天” 意味着恢复时使用一天前的数据,那么一天之内的数据就丢失了。

备份的分类

  • 备份内容
    • 操作系统备份
    • 数据备份
  • 备份数据量
    • 全量备份:备份所有数据
    • 增量备份:根据上一次备份所作的增量备份(在上一次备份的基础上备份)
    • 差异备份:根据上一次全量备份所作的差异备份(差异备份只对比上一次全量)
  • 备份的形式
    • 物理备份:备份真实数据
    • 逻辑备份:备份操作记录
  • 备份时是否需要停服务
    • 冷备份:将数据以隔离的方式进行保存,不受原数据影响,数据恢复慢,解决人为误操作。
    • 热备份:搭建冗余环境,恢复速度快,不能解决人为误操作。

2. 高可用(HA)

高可用的实现形式

  1. Active/Passive HA:集群只包括两个节点简称主备。在这种配置下,系统采用主和备用机器来提供服务,系统只在主设备上提供服务。在主设备故障时,备设备上的服务被启动来替代主设备提供的服务。典型地,可以采用 CRM 软件比如 Pacemaker 来控制主备设备之间的切换,并提供一个虚机 IP 来提供服务。
  2. Active/Active HA:集群只包括两个节点时简称双主,包括多节点时成为多主(Multi-master)。在这种配置下,系统在集群内所有服务器上运行同样的负载。以数据库为例,对一个实例的更新,会被同步到所有实例上。这种配置下往往采用负载均衡软件比如 HAProxy 来提供服务的虚拟 IP。
posted @ 2020-04-01 15:49  sihte  阅读(3921)  评论(0编辑  收藏  举报