认识zookeeper

之前稍微看了一下Hadoop相关的技术文档，有了解到Hbase用zookeeper做分布式应用程序协调服务。

现在做的项目里，也是用zookeeper做集群和负载均衡(从类名LoadBalance看来)。

一个东西接连两次在你眼前晃过，就算实际中没有去用到，但也让人不得不去认识它。

从官网和其他博客找了一下相关资料介绍，从关键字看来都是“分布式锁”，“数据节点”，“主从选举”，“Watch触发器”等，看了肯定一下子就蒙了。

总结了一下实际的开发项目跟它介绍的这些专业术语关联不是很大，很多人还没来得及认识zookeeper，就单纯因为这几个关键字，觉得反正跟它也不相关，用不到，就直接把zookeeper抛一边。

但事实只要项目中涉及到分布式运算，基本上还是得回到zookeeper的了解中。

下面举个实际的例子，看看zookeeper对于现在从事的项目，可能应用到的场景：

分布式锁

如果问用Java写个线程同步的功能，怎么做？其实这个很容易，因为Java处理多线程语法比较简单，直接在要同步的方法前面加synchronized修饰符，或者在方法体里加入synchronized的代码块，锁住某个对象，进行线程间的互斥同步。

public synchronized void create() {
    Object obj = new Object();
    obj.toString();
}

对于同一台电脑、同一个进程，这样的同步是能够做到。但一提到分布式，这种处理同步的方法就立马歇菜了。先不说分布式是多台电脑之间的同步，就是一台电脑里多个进城间的同步（比如同一台电脑启动两个Tomcat服务），上面的写法也是无法做到。

所谓数据一致性，就是分布式环境中，只要有一台服务器的数据变更，其他服务器也跟着改变。这听起来好像似曾相识的样子，没错，数据库集群就是这样的处理的，往数据库集群中插入一条数据，集群的每个节点都会全部更新。这也是为什么HBase要用zookeeper，因为它就是一个分布式数据库。

那zookeeper这个特性，对于我们现在项目有什么地方可以应用到？实际的项目不可能去实现数据库集群这样的功能。

“更改一台服务器数据，其他服务器也跟着变”，从这句，立马能想到的就是配置信息。一般把项目发布到服务器上，能做修改的，就是改项目中的配置信息（比如连接池，线程池数量，返回最大数据条数、查询的距离等）。这又涉及到一个场景，改五台十台服务器配置用手动方式倒还能接受，如果是几十台，上百台呢？

posted on 2016-01-19 21:40 恒久地平线阅读(319) 评论(0) 编辑收藏举报

刷新页面返回顶部