Zookeeper ZAB协议-客户端源码解析
因为在Zookeeper的底层源码中大量使用了NIO,线程和阻塞队列,在了解之前对前面这些有个基础会更容易理解
ZAB 是Zookeeper 的一种原子广播协议,用于支持Zookeeper 的分布式协调一致性和奔溃恢复的一种,但是ZAB 协议的源码比上一篇Zookeeper的Leader选举算法要复杂一些,所以分多篇进行分析
首先来一张简单的架构图,对Zookeeper客户端架构有个基本概念
这里从客户端开始,我们来看一下zk 的一个简单使用,下面是创建zk客户端,然后创建一个节点
new Zookeeper
见Zookeeper
zookeeper.create
见zookeeper.create
Zookeeper客户端初始化
Zookeeper
createConnection
实际上是创建了一个ClientCnxn
对象,在这个对象中保存了一些数据,比如苏红zookeeper
自身引用,监视器,sessionId
,过期时间,配置信息, 这里我们需要重点关注的是创建了两个线程sendThread
,eventThread
,这两个线程一个是用于发送数据,一个是用于事件处理的,详见ClientCnxn
zk 客户端启动,详见cnxn.start
ClientCnxn
ClientCnxn#start
cnxn.start
这里很简单,就是直接启动了初始化创建的两个线程,sendThread
,eventThread
, 因为这是两个线程,start 方法实际上是调用了该线程的run 方法
sendThread见 sendThread.run
eventThread 见 sendThread.run
SendThread#run
sendThread.run
因为这里暂时只分析主流程,有些分支流程就暂时先跳过了
这里主要是做了几件事,
1:zookeeper服务端连接,见sendThrad.startConnect
2:发送数据,见 ClientCnxnSocketNIO.doTransport
3:保持心跳连接,见
SendThread#startConnect
sendThrad.startConnect
因为我们这里采用的是默认的模式,在上文中已经创建了ClientCnxnSocketNIO
这个对象, 实际上就是使用NIO 的方式进行连接,具体如下图,代码很简单,如果有NIO 的基础,应该很好理解,就不再深入分析
ClientCnxnSocketNIO#doTransport
ClientCnxnSocketNIO.doTransport
我们默认是client 已经和ZK server 连接成功了,,这里线程已经启动完成了,然后阻塞在select 方法上,下面我们走zookeeper.create
的逻辑zookeeper.create
当执行完create后,selector 被唤醒了,同时outgoingQueue队列中存在数据,然后会执行后续发送数据的IO 操作,我们来看doIO
ClientCnxnSocketNIO#doIO
Zookeeper.create
在create方法中,主要是构建了请求参数,然后调用socket 的submitRequest
,提交请求服务端,详情见clientCnxn.submitRequest
ClientCnxn.submitRequest
总结一下:这里主要干下面几件事
1: 将请求参数封装成一个Packet,然后放到outgoingQueue
阻塞队列中,然sendThread 处理
2: 将当前线程wait 住, 等待完成或者请求超时后唤醒
3: 请求超时后的一些处理
ClientCnxn.queuePacket
ClientCnxnSocketNIO#doIO
在这个方法中主要执行两个步骤,因为代码较长,所以这一块分开进行分析
1:执行写事件
总结一下:
1:从一个outgoingQueue
队列中拿到一个Packet 数据, 因为前面我们执行create 逻辑的时候,已经往outgoingQueue
中放入数据了,所以这里是存在数据的
2: 如果这个Packet没有创建ByteBuffer
,那么创建一个ByteBuffer,并且赋值给packet 对象的bb 属性
3: 利用socket将packet数据发送出去
4:发送完成后,将packet数据添加到一个等待服务端响应的链表中
2:执行读事件
因为zk 请求会先发4个字节作为整个报文的长度,所以会创建一个指定大小的buffer空间来接收后续请求。具体读取数据在SendThread#readResponse
SendThread#readResponse
SendThread#readResponse
总结一下:在上述代码中总共干了几件事
1: 根据返回的数据类型,会走一些其他逻辑,比如心跳,权限认证
2: 如果返回的类型是-1, 说明是监听了节点数据变动后返回的结果,那么会创建一个监听结果事件放入到eventThrad 的waitingEvents 队列中,见EventThread#queueEvent
3: 如果是普通的结果,那么会从等待响应队列pendingQueue
中删除这次请求的packet
4: 根据packet 重置一些属性,比如事务id,反序列化响应信息
5: 执行结束packet 的方法,然后执行一些逻辑, 见ClientCnxn#finishPacket
ClientCnxn#finishPacket
EventThread#run
下面来看一下事件处理线程
eventThread run 方法总共执行了两个功能
1: 循环从事件的阻塞队列中获取事件
2: 执行事件 ClientCnxn.processEvent
ClientCnxn.processEvent
// 这里if 判断比较多,所以只展示了其中的一个同步的逻辑,有些分支逻辑是异步回调的逻辑
if (event instanceof WatcherSetEventPair) {
// each watcher will process the event
WatcherSetEventPair pair = (WatcherSetEventPair) event;
for (Watcher watcher : pair.watchers) {
try { // 在这里调用了我们传入的watcher 的process方法,实现通知
watcher.process(pair.event);
} catch (Throwable t) {
LOG.error("Error while calling watcher ", t);
}
}
}
EventThread#queueEvent
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南