Java面试题（8）Zookeeper

一、简述ZAB协议【zookeeper---CP】

二、Zookeeper的数据模型和节点类型【树结构/文件目录】

三、简述ZK的命名服务、配置管理、集群管理

四、Zookeeper watch机制的原理与实现

五、ZK与Eureka的区别

一、简述ZAB协议【zookeeper---CP】

ZAB协议是分布式协调服务Zookeeper专门设计的一种支持崩溃恢复的原子广播协议，实现分布式数据一致性，所有客户端的请求都是写入到Leader进程中，然后，由Leader同步到其他节点，称为 Follwer。在集群数据同步的过程中，如果出现Follower节点崩溃或者Leader进程崩溃时，都会通过Zab协议来保证数据一致性

ZAB协议包括两种基本的模式：崩溃恢复和消息广播

消息广播：

集群中所有的事务请求都由Leader节点来处理，其他服务器为Follower，Leader将客户端的事务请求转换为事务Proposal，并且将Proposal分发给集群中其他所有的Follower。

完成广播之后，Leader等待Follwer反馈，当有过半数的Follower反馈信息后，Leader将再次向集群内Follower广播Commit信息，Commit信息就是确认将之前的Proposal提交。

Leader节点的写入是一个两步操作，第一步是广播事务操作，第二步是广播提交操作，其中过半数指的是反馈的节点数>=N/2+1,N是全部的Follower节点数量。

崩溃恢复：

初始化集群，刚刚启动的时候

Leader崩溃，因为故障宕机

Leader失去了半数的机器支持，与集群中超过一半的节点断连

此时开启新一轮Leader选举，选举产生的Leader会与过半的Follower进行同步，使数据一致，当与过半的机器同步完成后，就推出恢复模式，然后进入消息广播模式。

整个Zookeeper集群的一致性保证就是在上面两个状态之前的切换，当Leader服务正常时，就是正常的消息广播模式；当Leader不可用时，则进入崩溃恢复模式，崩溃恢复阶段会进行数据同步，完成以后，重新进入消息广播阶段。

Zxid 是Zab协议的一个事务编号，Zxid是一个64位的数字，其中低32位是一个简单的单调递增计数器，针对客户端每一个事务请求，计数器加1；而高32位则代表Leader周期年代的编号。

Leader周期可以理解为当集群所处的年代或周期，每当有一个新的Leader选举出现时，就会以这个Leader服务器上取出其本地日志中最大事务的Zxid，并从中读取epoch值，然后加1，以此作为新的周期id，高32位代表了每代Leader的唯一性，低32位则代表了每代Leader中事务的唯一性。

zab节点的三种状态：

following：服从leader的命令
leading: 负载协调事务
election/looking：选举状态

二、Zookeeper的数据模型和节点类型【树结构/文件目录】

1、数据模型：在结构上和标准文件系统的非常相似，拥有一个层次的命名空间，都是采用树形层次结构，ZooKeeper树中的每个节点被称为—Znode。和文件系统的目录树一样，ZooKeeper树中的每个节点可以拥有子节点。

不同之处：

Znode兼具文件和目录两种特点，既像文件一样维护着数据、元信息、ACL、时间戳等数据结构，又像目录一样可以作为路径标识的一部分，并可以具有子Znode。用户对Znode具有增删改查的操作（权限允许的情况下）
Znode具有原子性操作，读操作将获取与节点相关的所有数据，写操作也将替换掉节点的所有数据。
Znode存储数据大小有限制，Zookeeper虽然可以关联一些数据，但并不能存储太大的数据，通常以KB为大小单位。ZK的服务器和客户端都被设计为严格检查并限制每个Znode的数据大小至多1M，当时常规使用中应该远小于此值。
Znode通过路径引用，如同Unix中的文件路径。

每个Znode由3部分组成：

stat：此为状态信息，描述该Znode的版本，权限等信息

data：与该Znode关联Znode关联的数据

children：该Znode下的子节点

2、节点类型

Znode有两种，分别为临时节点和永久节点。节点的类型在创建时即被确定，并且不能改变。

临时节点：该节点的生命周期依赖于创建它们的会话。一旦会话结束，临时节点将被自动删除，也可以手动删除。临时节点不允许拥有子节点。

永久节点：该节点的生命周期不依赖于会话，并且只有在客户端显示执行删除操作的时候，它们才能被删除。

Znode还有一个序列化的特性，如果创建的时候指定的话，该Znode的名字后面会自动追加一个不断增加的序列号。序列号对于此节点的父节点来说是唯一的，这样便会记录每个子节点创建的先后顺序。它的格式为“%10d”(10位数字，没有数值的数位用0补充，例如“0000000001”)。

三、简述ZK的命名服务、配置管理、集群管理

命名服务：通过指定的名字来获取资源或者服务地址。zookeeper可以创建一个全局唯一的路径，这个路径可以作为一个名字。被命名的实体可以是集群中的机器，服务器地址，或者远程的对象等。一些分布式服务框架（RPC、RMI）中的服务地址列表，通过使用命名服务、客户端或用能够根据特定的名字来获取资源的实体、服务地址和提供者信息等。

配置管理：实际项目中，经常使用.properties或者xml需要配置很多信息，如数据库连接信息、fps地址端口等。程序分布式部署时，如果把程序的这些配置信息保存在zk的znode节点下，当你需要修改配置、即znode会发送变化时，可以通过改变zk中某个目录节点的内容，利用watch通知给各个客户端，从而更改配置。

集群管理：集群管理包括集群监控和集群控制，就是监控集群机器的状态，剔除机器和加入机器。zookeeper可以方便集群机器的管理，它可以实时监控znode节点的变化，一旦发现有机器挂了，该机器会与zk断开链接，对应的临时目录节点会被删除，其他所有机器都收到通知，新机器加入也类似。

四、Zookeeper watch机制的原理与实现

因为ZK有watch机制，可以随时发现一些数据的变化，从而达到数据的及时性。

ZK的所有读操作都可以设置watch监视点：getData、getChildren、exists。写操作则是不能设置监视点的。

监视有两种类型：数据监视点和子节点监视点。创建、删除或者设置znode都会触发这些监视点。exists,getData 可以设置监视点。getChildren 可以设置子节点变化。

而可能监测的事件类型有: NodeCreated, NodeDataChanged, NodeDeleted, NodeChildrenChanged.

ZK可以做到，只要数据一发生变化，就会通知相应地注册了监听的客户端，那么其实现原理如下：

1. 客户端注册Watcher到服务端;
2. 服务端发生数据变更;
3. 服务端通知客户端数据变更;
4. 客户端回调Watcher处理变更应对逻辑;

五、ZK与Eureka的区别

SpringCloud和Dubbo都支持多种注册中心，目前主流的架构SpringCloud用Eureka较多，Dubbo则以Zookeeper为主。

1、从集群设计来看：Eureka集群各节点平等，没有主从关系，因此可能出现数据不一致的情况；ZK为了满足一致性，必须包含主从关系，一主多从。集群无主机点时不对外提供服务。

ZK：当主节点因为网络故障与其他的节点失去联系时，剩余的节点会重新选举Leader，但是选举Leader的过程中比较耗时，30s-120s，并且选举的期间整个集群不可用。这就导致选举期间服务不可用。

Eureka：各节点是平等的，几个节点挂掉不会影响正常的节点工作，剩余的节点依然可以提供注册和查询服务。当Eureka的客户端在向某个Eureka注册时如果发现失败，会自动切换到其他的节点，只要有一台Eureka还在，就能保证注册服务可用（保证了可用性），只是不能保证强一致性，可能查到的信息不是最新的。除此之外，Eureka还有自我保护机制，如果在15分钟内超过85%的节点都没有正常的心跳，那么Eureka就认为客户端与注册中心出现了网络故障，此时会出现以下几种情况：

Eureka不再从注册列表中溢出因为长时间没有心跳而应该过期的服务。
Eureka仍然能够接受新服务的注册和查询请求，但是不会被同步到其他节点上（即保证当前节点依然可用）
当网络稳定时，当前实例新的注册信息会被同步到其他节点中。

2、CAP原则来看：Zookeeper保证的是CP，Eureka保证的是AP。

3、服务拉取方式来看：Eureka采用的是服务主动拉取策略，消费者按照固定的频率（默认30s）去Eureka拉取服务并缓存到本地；ZK中的消费者首次启动到ZK订阅自己需要的服务信息，并缓存在本地。然后监听服务列表变化，以后服务变更ZK会推送给消费者。

因此，Eureka可以很好的应对因为网络故障而导致部分节点失去联系的情况，但是ZK则不行，遇到网络故障的时候整个注册服务瘫痪。

posted @ 2022-01-17 21:18 娜梓阅读(96) 评论(0) 收藏举报

刷新页面返回顶部

娜梓

一步一个脚印，在代码的世界越走越远........

Java面试题（8）Zookeeper

公告