Zookeeper基础原理&应用场景详解

简单了解Zookeeper

Tips: 如果之前对Zookeeper不了解的话，这里大概留个印象就好了

Zookeeper是一个分布式协调服务，可以用于元数据管理、分布式锁、分布式协调、发布订阅、服务命名等等。

例如，Kafka中就是用Zookeeper来保存其集群中的相关元数据，例如Broker、Topic以及Partition等等。同时，基于Zookeeper的Watch监听机制，还可以用其实现发布、订阅的功能。

在平常的常规业务使用场景下，我们几乎只会使用到分布式锁这一个用途。

Zookeeper内部运行机制

Zookeeper的底层存储原理，有点类似于Linux中的文件系统。Zookeeper中的文件系统中的每个文件都是节点（Znode）。根据文件之间的层级关系，Zookeeper内部就会形成这个这样一个文件树。

在Linux中，文件（节点）其实是分类型的，例如分为文件、目录。在Zookeeper中同理，Znode同样的有类型。在Zookeeper中，所有的节点类型如下：

持久节点（Persistent）
持久顺序节点（Persistent Sequential)
临时节点（Ephemeral）
临时顺序节点（Ephemeral Sequential）

所谓持久节点，就和我们自己在电脑上新建一个文件一样，除非你主动删除，否则一直存在。

而持久顺序节点除了继承了持久节点的特性之外，还会为其下创建的子节点保证其先后顺序，并且会自动地为节点加上10位自增序列号作为节点名，以此来保证节点名的唯一性。这一点上图中的subfiles已经给出了示例。

而临时节点，其生命周期和client的连接是否活跃相关，如果client一旦断开连接，该节点（可以理解为文件）就都会被删除，并且临时节点无法创建子节点；

PS：这里的断开连接其实不是我们直觉上理解的断开连接，Zookeeper有其Session机制，当某个client的Session过期之后，会将对应的client创建的节点全部删除

Zookeeper的节点创建方式

接下来我们来分别看看几种节点的创建方式，给出几个简单的示例。

创建持久节点

create /node_name SH的全栈笔记

这里需要注意的是，命令中所有的节点名称必须要以/开头，否则会创建失败，因为在Zookeeper中是不能使用相对路径，必须要使用绝对路径。

创建持久顺序节点

create -s /node_name SH的全栈笔记

可以看到，Zookeeper为key自动的加上了10位的自增后缀。

创建临时节点

create -e /test SH的全栈笔记

创建临时顺序节点

create -e -s /node_name SH的全栈笔记

Zookeeper的用途

我们通过一些具体的例子，来了解Zookeeper的详细用途，它不仅仅只是被当作分布式锁使用。

元数据管理

我们都知道，Kafka在运行时会依赖一个Zookeeper的集群。Kafka通过Zookeeper来管理集群的相关元数据，并通过Zookeeper进行Leader选举。

Tips: 但是即将发布的Kafka 2.8版本中，Zookeeper已经不是一个必需的组件了。这块我暂时还没有时间去细看，不过我估计可能会跟RocketMQ中处理的方式差不多，将其集群的元数据放到Kafka本身来处理。

分布式锁

基于Zookeeper的分布式锁其实流程很简单。首先我们需要知道加分布式锁的本质是什么？

答案是创建临时顺序节点

当某个客户端加锁成功之后，实际上则是成功的在Zookeeper上创建了临时顺序节点。我们知道，分布式锁能够使同一时间只能有一个能够访问某种资源。那这就必然会涉及到分布式锁的竞争，那问题来了，当前这个客户端是如何感知抢到了锁呢？

其实在客户端侧会有一定的逻辑，假设加锁的key为/locks/modify_users。

首先，客户端会发起加锁请求，然后会在Zookeeper上创建持久节点locks，然后会在该节点下创建临时顺序节点。临时顺序节点的创建示例，如下图所示。

当客户端成功创建了节点之后，还会获取其同级的所有节点。也就是上图中的所有modify_users000000000x的节点。

此时客户端会根据10位的自增序号去判断，当前自己创建的节点是否是所有的节点中最小的那个，如果是最小的则自己获取到了分布式锁。

你可能会问，那如果我不是最小的怎么办呢？而且我的节点都已经创建了。如果不是最小的，说明当前客户端并没有抢到锁。按照我们的认知，如果没有竞争到分布式锁，则会等待。等待的底层都做了什么？我们用实际例子来捋一遍。

假设Zookeeper中已经有了如下的节点。

例如当前客户端是B创建的节点是modify_users0000000002，那么很明显B没有抢到锁，因为已经有比它还要小的由客户端A创建的节点modify_users0000000001。

此时客户端B会对节点modify_users0000000001注册一个监听器，对于该节点的任意更新都将触发对应的操作。

当其被删除之后，就会唤醒客户端B的线程，此时客户端B会再次进行判断自己是否是序号最小的一个节点，此时modify_users0000000002明显是最小的节点，故客户端B加锁成功。

为了让你更加直观的了解这个过程，我把流程浓缩成了下面这幅流程图。

分布式协调

我们都知道，在很多场景下要保证一致性都会采用经典的2PC（两阶段提交），例如MySQL中Redo Log和Binlog提交的数据一致性保障就是采用的2PC，详情可以看基于Redo Log和Undo Log的MySQL崩溃恢复流程。

在2PC中存在两种角色，分别是参与者（Participant）和协调者（Coordinator），协调者负责统一的调度所有分布式节点的执行逻辑。具体协调啥呢？举个例子。

例如在2PC的Commit阶段，两个参与者A、B，A的commit操作成功了，但不幸的是B失败了。此时协调者就需要向A发送Rollback操作。Zookeeper大概就是这样一个角色。

发布订阅

由于Zookeeper自带了监听器（Watch）的功能，所以发布订阅也顺理成章的成为了Zookeeper的应用之一。例如在某个配置节点上注册了监听器，那么该配置一旦发布变更，对应的服务就能实时的感知到配置更改，从而达到配置的动态更新的目的。

给个简单的Watch使用示例。

命名服务

用大白话来说，命名服务主要有两种。

单纯的利用Zookeeper的文件系统特性，存储结构化的文件
利用文件特性和顺序节点的特性，来生成全局的唯一标识

前者可以用于在系统之间共享某种业务上的特定资源，后者则可以用于实现分布式锁。

好了以上就是本篇博客的全部内容了，欢迎微信搜索关注【SH的全栈笔记】，回复【队列】获取MQ学习资料，包含基础概念解析和RocketMQ详细的源码解析，持续更新中。

如果你觉得这篇文章对你有帮助，还麻烦点个赞，关个注，分个享，留个言。

posted @ 2021-04-21 09:22 detectiveHLH 阅读(1277) 评论(0) 编辑收藏举报

刷新页面返回顶部

SH的全栈笔记

微信搜一搜「SH的全栈笔记」