HDFS的高可用HA(High Available)、Zookeeper简介、Zookeeper的搭建、Zookeeper的基本操作

HDFS的HA(High Available)

Zookeeper简介

Zookeeper是一个高效的分布式协调服务,可以提供配置信息管理、命名、分布式同步、集群管理、数据库切换等服务。它不适合用来存储大量信息,可以用来存储一些配置、发布与订阅等少量信息。Hadoop、Storm、消息中间件、RPC服务框架、分布式数据库同步系统,这些都是Zookeeper的应用场景。

Zookeeper集群中节点个数一般为奇数个(>=3),若集群中Master挂掉,剩余节点个数在半数以上时,就可以推举新的主节点,继续对外提供服务。

客户端发起事务请求,事务请求的结果在整个Zookeeper集群中所有机器上的应用情况是一致的。不会出现集群中部分机器应用了该事务,而存在另外一部分集群中机器没有应用该事务的情况。在Zookeeper集群中的任何一台机器,其看到的服务器的数据模型是一致的。Zookeeper能够保证客户端请求的顺序,每个请求分配一个全局唯一的递增编号,用来反映事务操作的先后顺序。Zookeeper将全量数据保存在内存中,并直接服务于所有的非事务请求,在以读操作为主的场景中性能非常突出。

Zookeeper使用的数据结构为树形结构,根节点为"/"。Zookeeper集群中的节点,根据其身份特性分为leader、follower、observer。leader负责客户端writer类型的请求;follower负责客户端reader类型的请求,并参与leader选举;observer是特殊的follower,可以接收客户端reader请求,但是不会参与选举,可以用来扩容系统支撑能力,提高读取速度。

Zookeeper是一个基于观察者模式设计的分布式服务管理框架,负责存储和管理相关数据,接收观察者的注册。一旦这些数据的状态发生变化,zookeeper就负责通知那些已经在zookeeper集群进行注册并关心这些状态发生变化的观察者,以便观察者执行相关操作。

Zookeeper使用的是ZAB原子消息广播协议,节点之间的一致性算法为Paxos,能够保障分布式环境中数据的一致性。分布式场景下高可用是Zookeeper的特性,可以采用第三方客户端的实现,即Curator框架。

Paxos 算法解决的问题是一个分布式系统如何就某个值(决议)达成一致。一个典型的场景是,在一个分布式数据库系统中,如果各节点的初始状态一致,每个节点执行相同的操作序列,那么他们最后能得到一个一致的状态。为保证每个节点执行相同的命令序列,需要在每一条指令上执行一个“一致性算法”以保证每个节点看到的指令一致。一个通用的一致性算法可以应用在许多场景中,是分布式计算中的重要问题。因此从20世纪80年代起对于一致性算法的研究就没有停止过。节点通信存在两种模型:共享内存(Shared memory)和消息传递(Messages passing)。Paxos 算法就是一种基于消息传递模型的一致性算法。

不仅仅是分布式系统中,凡是多个过程需要达成某种一致的场合都可以使用Paxos 算法。一致性算法可以通过共享内存(需要锁)或者消息传递实现,Paxos 算法采用的是后者。Paxos 算法适用的几种情况:一台机器中多个进程/线程达成数据一致;分布式文件系统或者分布式数据库中多客户端并发读写数据;分布式存储中多个副本响应读写请求的一致性。

Zookeeper的搭建

1、上传安装包到master并解压

tar -zxvf zookeeper-3.4.6.tar.gz -C /usr/local/soft/

2、配置环境变量

vim /etc/profile

ZOOKEEPER_HOME=/usr/local/soft/zookeeper-3.4.6
export PATH=$PATH:$ZOOKEEPER_HOME/bin

source /etc/profile

3、修改配置文件

cd /usr/local/soft/zookeeper-3.4.6/conf

cp zoo_sample.cfg zoo.cfg

vim zoo.cfg
#修改
dataDir=/usr/local/soft/zookeeper-3.4.6/data
#在zoo.cfg文件末尾添加
server.0=master:2888:3888
server.1=node1:2888:3888
server.2=node2:2888:3888

4、新建data目录并新建myid文件

cd /usr/local/soft/zookeeper-3.4.6
mkdir data
cd data
touch myid

5、同步到其它节点

cd /usr/local/soft
scp -r zookeeper-3.4.6/ node1:`pwd`
scp -r zookeeper-3.4.6/ node2:`pwd`

6、配置node1和node2的环境变量,并刷新环境变量的配置文件

7、编辑/usr/local/soft/zookeeper-3.4.6/data/myid

master,node1,node2分别在myid中添加0,1,2

Zookeeper的基本操作

启动Zookeeper

zkServer.sh start  #三台都需要执行

查看Zookeeper状态

zkServer.sh status

停止Zookeeper

zkServer.sh stop  #三台都需要执行

#jps查看进程

连接、退出Zookeeper

zkCli.sh  #连接本地的Zookeeper
zkCli.sh -server 主机名:端口号  #连接远程的Zookeeper 端口号是2181
quit  #退出连接

zk  是一个目录结构 ,每个节点可以存数据,同时可以有子节点
在Zookeeper上没有文件的概念,它只有目录及目录上存的数据

Zookeeper的帮助命令help

help  #提示你可以使用哪些命令

查看Zookeeper下的目录

ls 路径
#例如
ls / #查看Zookeeper根目录

创建目录

create 目录 目录的数据

删除节点

rmr 目录

修改节点的数据

set 目录 目录修改的数据

Zookeeper是一个去中心化的架构,当你对一个节点进行操作的时候,你的操作会同步到其他节点---一致性

并且节点中会随机产生 leader 和 follower(多个)。

posted @ 2022-02-12 00:02  赤兔胭脂小吕布  阅读(36)  评论(0编辑  收藏  举报