MongoDB 复制集(1/2) - 机制及原理简介

1.复制集的作用

  • 主要意义在于实现服务的高可用性。
  • 它的实现依赖于两方面:
    • 数据写入时将数据迅速复制到另一个独立节点上。
    • 在接受写入的节点发生故障时自动选举出一个新的替代节点。
  • 在实现高可用的同时,复制集实现了其他几个附加作用:
    • 数据分发:将数据从一个区域复制到另一个区域,减少另一个区域的读延迟。
    • 读写分离:不同类型的压力分别在不同的节点上执行。
    • 异地容灾:在数据中心故障时候快速切换到异地。

2.典型复制集结构

  • 一个典型的复制集由3个以上具有投票权的节点组成,包括:
    • 一个主节点(Primary):接受写入操作和选举时投票。
    • 两个(或多个)从节点(Secondary):复制主节点上的新数据和选举时投票。
    • 不推荐使用Arbiter(投票节点,不进行数据存取只是为了防止出现平票的情况)。
    • 现在推荐使用三个节点同时储存数据和同时拥有投票权,最常见的还是三节点结构。
    • 强烈不建议单节点。

3.数据是如何进行复制的?

  • 当一个修改操作(插入/更新/删除)到达主节点时,它对数据的操作将被记录下来(经过一些必要的转换),这些记录称为 oplog
  • 从节点通过主节点上打开一个 tailable 游标不断获取新进入主节点的oplog,并在自己的数据上回放,以此保持与主节点的数据一致。

4.选举?如何通过选举完成故障恢复?

  • 具有投票权的节点之间两两发送心跳;
  • 当5次心跳未收到判断为节点失联;
  • 如果失联的是主节点,从节点会发起选举,选出新的主节点;
  • 如果失联的是从节点则不会出现新的选举;
  • 复制集中最多可以有50个节点,但具有投票权的节点最多7个;
  • 选举基于RAFT一致性算法实现,选举成功的必要条件是大多数投票节点存活(3个节点必须有2个以上;5个必须有3个;7个必须有4个);

5.影响选举的因素有哪些?

  • 整个集群必须有大多数节点存活(过半数);
  • 被选举为主节点的节点的必要节点:
    • 能够与多数节点建立连接;
    • 相比于其他节点必须具有较新的oplog,起码是同等的,不能比其他节点旧;
    • 如果有配置优先级,需要比其他节点的优先级高;

6.复制集节点的常见选配项:

  • 是否具有投票权(v参数):有则参与投票;
  • 优先级(priority参数):优先级越高的节点越优先称为主节点。优先级为0的节点无法成为主节点
    (比如把硬件较好的节点优先级调高一点);
  • 隐藏(hidden参数):复制数据,但对应用不可见。隐藏节点可以具有投票权,但优先级必须为0 。
  • 延迟(slaveDelay参数):复制 n 秒之前的数据,保持与主节点的时间差。
    (比如用来做数据备份 - 防止主节点的数据被误删之后延迟的节点通常为n小时的可以在发现之后用来恢复数据。)

7.复制集注意事项:

  • 关于硬件:
    • 有可能进行选举成为主节点(除了隐藏节点,延迟节点)的复制集节点的地位和主节点是一样的,因此硬件配置上必须一致;
      (防止从节点变成主节点后扛不住应用的压力)
    • 为了保证节点不会同时宕机,各节点使用的硬件必须具有独立性。
      (最好不要使用同一电源或同一机柜或同一机房之内,尽可能保持独立性。)
  • 关于软件
    • 复制集各节点软件版本必须一致,以避免出现不可预知的问题。
  • 增加从节点不会增加系统写性能!
    (通过在从节点上读取,只能提高读取的性能。)

posted on 2021-03-26 17:32  Sweet小马  阅读(119)  评论(0编辑  收藏  举报

导航