ZooKeeper Overview(未完)
一篇翻译 原文ZooKeeper Overview
ZooKeeper
ZooKeeper:一个提供给分布式应用的调度协调系统
ZooKeeper 是一个提供给分布式应用的分布式协调服务。它提供一组调度应用的简单的集合,在这些简单应用上可以构建更高层的同步服务、配置维护信息、群组和命名。ZooKeeper被设计成易于编程实现,并且使用一种类似于目录树结构文件系统的数据模型。它用java运行,同时绑定于java和c。 周所周知,协同服务难以清楚无误地被了解。尤其在类似于存在竞争条件或死锁时,更是容易出错。而ZooKeeper背后的动机就是解决来自随机应用调用的。
设计目标
ZooKeeper 足够简单。ZooKeeper 允许通过一个共享且分层的命名空间的各个调动应用协同工作,这些命名空间被简单地管理为一个基础的文件系统。之前提到的命名空间由一些数据记录的东西组成,这些东西被称作znodes用ZooKeeper口气来说,而以上这些就像是文件和目录。不想一个典型的用来存储的文件系统,ZooKeeper 数据存在内存里,那这就意味着ZooKeeper能达到很高的吞吐量和低延迟。
ZooKeeper implementation 注重且有高性能,高可靠性,严格有序的调用方式。ZooKeeper的性能方面意味着他可以用在大型分布式的系统中。可靠性方面使它免于成为一个失败的小东西。严格的顺序则意味着复杂精致的同步元步骤可以在客户端上实现。
ZooKeeper 是可复用的。就像被调度的进程之间相互合作,ZooKeeper它也会尝试复制自己基于一组被称为ensemble的hosts之上。
提供ZooKeeper 服务的服务器之间一定是相互知晓。它们在内存里维护一个状态映像,还有处理日志和持久存储的快照。只要多数服务器还可用,那么ZooKeeper 服务就可用。 客户端会和其中一台ZooKeeper 服务器相联接。联接的客户端会维护一个TCP连接,通过这个连接,客户端可以提交请求、得到应答、得到Watch events、发送心跳信息。如果这个连往服务器的TCP连接断开,那客户端则会联接其他服务器去。 ZooKeeper 是有序的。ZooKeeper 给每次事务更新都赋予编号,这编号则显示ZooKeeper 所有的事务顺序。那么后面操作时则可以依赖之前的顺序实现高级抽象的操作,例如实现同步元操作。 ZooKeeper是快速的。尤其是进行读入为主的操作。ZooKeeper 应用通常会同时运行数以千计的机器,在读操作比写操作更常用得多时(比率在10:1左右)ZooKeeper 表现得最好。
数据模型和分层的命名空间
由ZooKeeper提供的命名空间,非常像一个简单的文件系统。一个名字就是一串由反斜杠(/)分割的路径元素序列。每个ZooKeeper 命名空间的节点都被一个路径所定义。
节点和短暂节点
不像一般简单的文件系统,在一个ZooKeeper 命名空间的每个节点都可以拥有自己的数据就像自己的孩子一样。这就像有了一个允许一个文件可以同时为一个文件夹这样的文件系统。(ZooKeeper 就是为存储调度数据:状态信息、配置、位置信息及其他调度数据而设计,所以存储在节点里的数据通常比较小,在byte级到Kb级间)我们使用术语znode 来特指在讲ZooKeeper 数据节点相关的东西。 znodes 维护一个状态结构,这个状态结构里包含了数据变化的版本编号,权限变动信息,时间戳。这样之后就能够缓存(cache)这些“证据”和调度更新。每次一个Znode数据一更新,版本编号也会改变。举例来说,只要客户端获取数据,那同时他也会拿到这份数据的版本。 存在每个在命名空间znode 中的数据的读写操作都作为元操作来执行。读时会拿到与一个znode节点相关的所有数据,而写时则会替换掉所有的数据。每个节点都有版权控制,这就限制了用户只能做权限内的操作。
本文由MarkDown自动生成