zookeeper安装搭建

一  zookeeper介绍  

     因为要使用kafka,但是不想用kafka自带的,而且考虑到后面别的地方需要使用,比如分布式job,觉得独立的比较好。

     zookeeper目前资料一大把,但是一是我需要锻炼写blog的能力,还有就是万一有一些别人没讲到的,给大家带来惊喜,岂不美哉。

     zookeeper官方介绍:一个为分布式应用提供分布式协调的服务。

  设计目标(Design Goals)

简单: zookeeper 允许通过一个共享层的namespace去相互协调,这个namespace的组织结构很像一个标准的文件系统。namespace是由叫做 znodes的数据项组成。在zookeeper说法中,和文件和文件目录有相似之处。不像一个典型文件系统,被设计用来存储。Zookeeper数据被保存在memory,另一个意思就是它可以实现高的生产力。zookeeper可以被使用在一个大规模分布式系统,而且在一个单元失败还是可以保持运行,在客户端实现了复杂同步能力。

       zookeeper复制(ZooKeeper is replicated)  

 

  zookeeper通过一一套hosts去复制,名叫ensemble。支撑zookeeper服务的服务器,必须相互可以访问通。在一个持久存储中,他们保留一个在内存中的image状态,和一个事务日志和镜像在一起。

客户端连接一个单个zookeeper服务。客户端维护一个tcp连接,通过它发送请求,得到请求和watch events,和发送心跳包。如果一个tcp连接断掉,客户端将连接另外一个服务。

     zookeeper是有秩序的(ZooKeeper is ordered)

   zookeeper的每一个印记更新一个数字,反映了全部zookeeper事务的秩序。后面的操作能使用这个秩序去实现高级别的抽象,正如同步。

    zookeeper是高速的(ZooKeeper is fast)

在读占优势负载中它是尤其的快。zookeeper应用运行在上千的机器上,而且它工作最好的情况下是读通常比写多,比率是大约10:1

数据模型和命名层(Data model and the hierarchical namespace)

命名空间很像一个独立的文件系统。一个名字是一个被slash(/)分割的路径元素序列。每一个节点在在zookeeper的命名空间中被标志为一个路径来使用

 

 

 

 节点和临时节点(Nodes and ephemeral nodes)

不像一个标准的文件系统,每个节点在一个zookeeper命名空间中能有数据关联,这个命名空间同样有子节点。它是像一文件系统允许一个文件也可以是一个目录。(zookeeper被设计去存储协调数据:状态信息,配置,位置信息等,因此存储数据在每一个节点通常是小的,在1byte到kb的范围吧)我们使用term znode去让 我们正在讨论的 的zookeeper数据节点更清楚。

znodes维护一个状体结构,包含了版本号为每一个数据更改,ACL更改,和时间戳去允许缓存验证和协调更新。每次一个znode的数据更改,版本号自增。比如一个实例,,无论何时一个客户端检索数据,它总是接受一个版本的数据。

在一个namespace中存储在每一个节点的数据,是原子的读和写。读获取关联一个znode的全部数据,一个写替换全部数据。每个节点有一个访问控制列表(ACL)限制谁能做那些。

zookeeper也有一个临时node的概念。这些znodes与创建这些znodes的session存在一样久。如果session结束,znode就删除。

协调更新和watches(Conditional updates and watches)

zookeeper支持watches的思想。客户端能设置一个watch在一个znodes。znode更改的时候,一个watch将被triggered和移除。一个watch被激发,客户端接收一个packet,说znode已经更改。然后如果在一个服务到客户端的连接被破坏,客户端将接受一个本地通知。

Guarantees

 zookeeper是一个非常快和非常简单的,自从它的目标,虽然,是计划作为一个基本为一个更复杂服务结构,正如同步。它实现一套保证。

         1  时序一致,从一个客户端的更新被应用在一个先来后到的秩序上

          2 原子,更新或者成功,或者失败

          3 单个系统image,不管服务连接的是那个服务器,对客户端来说看到的都是相同景象。

          4 可靠,一旦一个更新已经被应用,它将持续从那个时间直到一个客户端覆盖更新它。

          5  及时,客户端系统的面貌被担保是在某个时间界限中是最新的。

 

Simple API

     create 创建一个znode

delete  删除一个node

exists  测试一个node是否在一个位置存在

get 从一个node读取数据

set 写一个data去一个node

get children  检索一个node的子项的列表

sync 等待数据去被传播

实现(Implementation)

zookeeper组件展示zookeeper服务的较高层面的成分。每一个组成zookeeper服务的服务器复制它自己每一个componets的copy。

复制数据库是一个内存数据库,包含整个数据树。更新记录日志在硬盘为了恢复。然后写是序列化到硬盘,在他们应用到内存前。

每一个zookeeper服务器服务客户端。客户端准确连接到一个服务器去提交请求。读请求从每个服务器数据库的本地复制中提供服务,写请求被一个一致性协议处理,

从客户端的全部写请求一致性协议部分,被趋向一个单个的服务器,名叫leader。其余的,叫followers,从leader接受消息提议和商定传递消息。消息层处理失败替换leader和同步followers和leaders。

 

二 zookeeper使用             

 下载:http://mirrors.shu.edu.cn/apache/zookeeper/zookeeper-3.4.13/

 

wget http://mirrors.shu.edu.cn/apache/zookeeper/zookeeper-3.4.13/zookeeper-3.4.13.tar.gz

看看目录:

  

首先看配置文件conf/zoo.cfg:

tickTime=2000
dataDir=/var/lib/zookeeper
clientPort=2181
tickTime
          微妙为基本单位,它被使用作为heartbeats和最低限度的session超时,超市将是两次ticktime。
dataDir
          存储内存数据库镜像,除非指定了其他,对数据库更新的事务日志
clientPort

监听端口

我们创建一个cfg文件,然后将上面的配置写入,然后现在可以启动:

 

 

 然后去连接:

bin/zkCli.sh -server 127.0.0.1:2181

这样的结果证明连接成功

使用help去查询命令:

命令自己去玩吧,这个必须实践,接下来去看看zookeeper的复制

Running Replicated ZooKeeper

运行zookeeper在一个单独的模式下对于开发测试是很方便的,但是生产环境,你是运行在一个复制mode下的,一个服务器复制组在相同的应用,叫做quorum,而且再复制模式,全部服务器在quorum有相同的配置文件。

 注意:对于复制模式,需要最少3个服务器,强烈推荐服务器数量是奇数。

下面是复制模式的配置:

tickTime=2000
dataDir=/var/lib/zookeeper
clientPort=2181
initLimit=5
syncLimit=2
server.1=zoo1:2888:3888
server.2=zoo2:2888:3888
server.3=zoo3:2888:3888

 

 initLimit:新的入口,是用于针对过时,zookeeper用来限制在quorum去连接一个leader的时间长度。

syncLimit:限制一个服务从一个leader多大的成都过时。

如果你指定了一个tickTime,在如上例子中,那么超时就是10秒。

而正server.x,当服务启动,它知道那个服务被查找文件myid在data目录。那个文件包含这服务的编号。

 

 

 

posted @ 2018-12-25 23:26  无为有道  阅读(232)  评论(0编辑  收藏  举报