【Zookeeper】Zookeeper的Leader选举流程
一、Zookeeper集群
Zookeeper可以配置多个实例共同构成一个集群对外提供服务以达到水平扩展的目的,每个服务器上的数据都是相同的,每一个服务器均可以对外提供读和写的服务,这点和Redis是相同的,即对客户端来说每个服务器都是平等的。
在集群中,需要一个Leader来完成处理事务,协调Zookeeper中的其他节点等工作,接下来就来介绍Zookeeper集群是如何选择出一个Leader节点的。
1. ZK集群中服务器的状态
Zookeeper集群中服务器被划分为以下四种状态
-
LOOKING:寻找Leader状态。处于该状态的服务器会认为集群中没有Leader,需要进行Leader选举;
-
FOLLOWING:跟随着状态,说明当前服务器角色为Follower;
-
LEADING:领导者状态,表明当前服务器角色为Leader;
-
OBSERVING:观察者状态,表明当前服务器角色为Observer。
2. 选票信息
每个选票中包含四个最基本的信息,服务器的ID,数据ID,逻辑时钟以及选举状态:
- 服务器ID:即myId,服务器的唯一标识,编号越大在选择算法中的权重越大;
- 数据ID:服务器中存放的最大数据ID,值越大说明数据越新,在选举算法中数据新权重越大;
- 逻辑时钟:Epoch,逻辑时钟,或者叫投票次数,同一轮投票过程时钟值是相同的,每投完一次票这个数据就会增加,然后与接收到的其他服务器返回的投票信息中的数值相比,根据不同的值做出不同的判断;
- 选举状态:即上文提到的四种状态。
3. Leader选举的触发时机
- 集群启动,这个时候需要选举出新的Leader;
- Leader服务器宕机;
- Follow服务器宕机后,Leader服务器发现自己已经没有过半的Follow跟随自己了,不能对外提供服务(领导者选举)。
二、Leader的选举流程
1. 服务器启动时期的Leader选举
假设想在的有三台机器搭建集群,在集群初始化阶段,当只有一个服务器(Server1)启动时,无法完成Leader的选举;当第二台服务器(Server2)启动后,两台机器开始互相通信,每台机器都会尝试去选举Leader,于是进入了Leader选举过程,这个过程大概如下:
-
每个Server发出一个投票投给自己。在初始情况下,Server1和Server2都会将自己作为Leader,将票投给自己。每次投票会包含所推举的服务器的myid和ZXID,使用(myid,ZXID)来表示,此时Server1的投票为(1, 0),Server2的投票为(2, 0),然后各自将这个投票发给集群中的其他机器;
-
接受来自各个服务器的投票。集群的每个服务器收到投票后,首先判断该投票是否有效,如检查是否是本轮投票、是否来自LOOKING状态的服务器;
-
处理投票。针对每一个投票,服务器都需要将别人的投票和自己的投票进行PK,PK的规则如下:
- 优先检查ZXID。ZXID比较大的服务器优先作为Leader;
- 如果ZXID相同,那么就比较myid。myid较大的服务器作为Leader服务器。
对于Server1而言,它的投票是(1, 0),接收Server2的投票为(2, 0),首先会比较两者的ZXID,均为0,再比较myid,此时Server2的myid最大,于是更新自己的投票为(2, 0),然后重新投票,对于Server2而言,其无须更新自己的投票,只是再次向集群中所有机器发出上一次投票信息即可。
-
统计投票。每次投票后,服务器都会统计投票信息,判断是否已经过半机器接收到相同的投票信息,对于Server1、Server2而言,都统计出集群中已经有两台机器接受了(2, 0)的投票信息,此时便认为已经选出了Leader。
-
改变服务器状态。一旦确定了Leader,每个服务器都会更新自己的状态,如果是Follower,那么就变更为FOLLOWING,如果是Leader,就变更为LEADING。
2. 服务器运行期间的 Leader 选举
在Zookeeper运行期间,即便有新服务器加入,也不会影响到Leader,新加入的服务器会将原有的Leader服务器视为Leader,进行同步。但是一旦Leader宕机了,那么整个集群就将暂停对外服务,进行新一轮Leader的选举,其过程和启动时期的Leader选举过程基本一致。假设正在运行的有Server1、Server2、Server3三台服务器,当前Leader是Server2,若某一时刻Leader挂了,此时便开始Leader选举。选举过程如下:
- 变更状态。Leader宕机后,余下的非Observer服务器都会将自己的服务器状态变更为LOOKING,然后开始进行Leader选举流程;
- 每个Server会发出一个投票。在这个过程中,需要生成投票信息(myid,ZXID)每个服务器上的ZXID可能不同,我们假定Server1的ZXID为123,而Server3的ZXID为122;在第一轮投票中,Server1和Server3都会投自己,产生投票(1, 123),(3, 122),然后各自将投票发送给集群中所有机器;
- 接收来自各个服务器的投票。与启动时过程相同;
- 处理投票;
- 统计投票;
- 改变服务器的状态。