Zookeeper的选举机制

为什么要进行Leader选举？
Leader 主要作用是保证分布式数据一致性，即每个节点的存储的数据同步。遇到以下两种情况需要进行Leader选举

服务器初始化启动
服务器运行期间无法和Leader保持连接，Leader节点崩溃，逻辑时钟崩溃。

服务器初始化时Leader选举

Zookeeper由于其自身的性质，一般建议选取奇数个节点进行搭建分布式服务器集群。以3个节点组成的服务器集群为例，说明服务器初始化时的选举过程。启动第一台安装Zookeeper的节点时，无法单独进行选举，启动第二台时，两节点之间进行通信，开始选举Leader。

每个Server投出一票。他们两都选自己为Leader，投票的内容为（SID，ZXID）。
SID即Server的id，安装zookeeper时配置文件中所配置的myid；ZXID，事务id，
为节点的更新程度，ZXID越大，代表Server对Znode的操作越新。由于服务器初始化，
每个Sever上的Znode为0，所以Server1投的票为（1,0），Server2为（2,0）。
两Server将各自投票发给集群中其他机器。
每个Server接收来自其他Server的投票。集群中的每个Server先判断投票有效性，
如检查是不是本轮的投票，是不是来Looking状态的服务器投的票。
对投票结果进行处理。先了解下处理规则

首先对比ZXID。ZXID大的服务器优先作为Leader
若ZXID相同，比如初始化的时候，每个Server的ZXID都为0，
就会比较myid，myid大的选出来做Leader。

对于Server而言，他接受到的投票为（2,0），因为自身的票为（1,0），所以此时它会选举Server2为Leader，
将自己的更新为（2,0）。而Server2收到的投票为Server1的（1,0）由于比他自己小，
Server2的投票不变。Server1和Server2再次将票投出，投出的票都为（2,0）。

统计投票。每次投票之后，服务器都会统计投票信息，如果判定某个Server有过半的票数投它，
那么该Server将会作为Leader。对于Server1和Server2而言,统计出已经有两台机器接收了（2,0）的投票信息，
此时认为选出了Leader。
改变服务器状态。当确定了Leader之后，每个Server更新自己的状态，
Leader将状态更新为Leading，Follower将状态更新为Following。

服务器运行期间的Leader选举

Zookeeper运行期间，如果有新的Server加入，或者非Leader的Server宕机，那么Leader将会同步数据到新Server或者寻找其他备用Server替代宕机的Server。若Leader宕机，此时集群暂停对外服务，开始在内部选举新的Leader。假设当前集群中有Server1、Server2、Server3三台服务器，Server2为当前集群的Leader，由于意外情况，Server2宕机了，便开始进入选举状态。过程如下

变更状态。其他的非Observer服务器将自己的状态改变为Looking，开始进入Leader选举。
每个Server发出一个投票（myid，ZXID），由于此集群已经运行过，所以每个Server上的ZXID可能不同。
假设Server1的ZXID为145，Server3的为122，第一轮投票中，Server1和Server3都投自己，
票分别为（1，145）、（3,122）,将自己的票发送给集群中所有机器。
每个Server接收接收来自其他Server的投票，接下来的步骤与初始化时相同。

posted @ 2024-04-13 21:38 有虫子啊阅读(23) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· es集群、索引压缩以及相关度评分计算

· MongoDB复制集

· 一文搞懂zookeeper选主流程

· zookeeper选举机制

· Zookeeper-Leader选举

公告

昵称：有虫子啊
园龄： 7年5个月
粉丝： 7
关注： 3

+加关注

2025年3月

日

一

二

三

四

五

六

有虫子啊

Zookeeper的选举机制

服务器初始化时Leader选举

服务器运行期间的Leader选举

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论