Zookeeper算法原理笔记

一、定义:基于消息传递的【一致性算法】

二、算法的前提:没有拜占庭将军问题;可信的计算机环境中才成立

三、故事描述

  有一个叫做paxos的小岛,上面居住了一些居民

  岛上的事情由一些特殊的人决定:议员(senator)

  岛上环境事务的变更都需要通过一个提议(Proposal),每个提议都有一个编号(PID),这个编号是一直增长的,不能减少

  每个提议都需要超过半数的议员同意才能执行(senator count/2 + 1)

  每个议员只会同意大于当前编号的提议(包含已生效和未生效的),当前编号是议员自己记录的,每次会议并不能保证每个议员自己记录的当前编号是一致的

  如果小于等于当前编号,则意味着已经有人提过了

  会议的目的:所有的议员对于提议达成一致的看法

 

四、ZAB:基于paxos算法为zookeeper定制的分布式一致性算法

  1、四个阶段:

  • 选举阶段:发现leader挂掉了,需要重新选举
  • 发现阶段:选出新的leader,进行连接,同步状态
  • 同步阶段:同步leader上一阶段的副本数据
  • 广播阶段:对外提供服务,消息广播

  

  2、节点的三种状态:

  • FOLLOWING:追随
  • LEADING:领导
  • LOKING:查找选举新Leader

  3、特性:简单和快。虽然可以存储数据,但zookeeper的设计目标并非用于数据库使用,而是分布式协调。其要求的一些特性

  • 高可用&故障容忍(和强一致性冲突)
  • 快(理论上和强一致性也是冲突的,主要是由于要达到数据的一致性,然后又要在一定时间内响应)- 为什么快:因为采用的是基于消息传递(消息队列:顺序)的最终一致性协议(最终一致性可以容忍网络波动和单点故障),使得在一定时间内可以对客户端的请求作出一定响应,但注意:zookeeper更适用于读的比例高于写的比例的场景(如1:10)
  • 在spring 体系中的常规应用:config & discovery;配置和服务发现
  • 可应用在分布式锁(临时节点-session级别,断开后或session失效后则消失),此特性应也可用于微服务的服务管理

  

  4、角色:

  • Leader:领导者,负责写
  • Follower:追随者,负责读
  • Observer:基于zookeeper的设计目标,是要有极快的客户端响应速度,在故障恢复的时候需要重新选举,过多的节点参与选举会影响响应速度;而此角色是不参与投票的。故不会影响故障恢复的200ms目标   

 

 

面试题:zk是CAP中的什么?(一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance))

强一致性

1、首先zk有领导机制,即领导说的最准

2、领导有可能挂掉,这个时候怎么保证下属中的数据是最新的?这边涉及到每次的议程都是需要过半表决,也就是说,最新的议程结果一定是被大多数人所同意(同步)的

3、但我们再仔细看一下,由于是过半,而不是全部的人都同意。那就是说如果同意的人全挂了。那数据就丢了,所以CAP定理只能是互相制约,没有所谓的绝对

posted @ 2020-09-18 12:48  gabin  阅读(482)  评论(0编辑  收藏  举报