关于 php for zookeeper

原文:Distributed application in PHP with Apache Zookeeper

地址:http://systemsarchitect.net/distributed-application-in-php-with-apache-zookeeper/

 

 

Apache Zookeeper是我最近遇到的最酷的技术,我是在研究Solr Cloud功能的时候发现的。Solr的分布式计算让我印象深刻。你只要开启一个新的实例就能自动在Solr Cloud中找到。它会将自己分派到某个分片中,并确定出自己是一个Leader(源)还是一个副本。不一会儿,你就可以在你的那些服务器上查询到了。即便某些服务器宕机了也可以继续工作。非常动态、聪明、酷。

将运行多个应用程序作为一个逻辑程序并不是什么新玩意。事实上,我在几年前就已写过类似的软件。这种架构比较让人迷惑,使用起来也费劲。为此Apache Zookeeper提供了一套工具用于管理这种软件。

为什么叫Zoo?“因为要协调的分布式系统是一个动物园”。

在本篇文章中,我将说明如何使用PHP安装和集成Apache ZooKeeper。我们将通过service来协调各个独立的PHP脚本,并让它们同意某个成为Leader(所以称作Leader选举)。当Leader退出(或崩溃)时,worker可检测到并再选出新的leader。

ZooKeeper是一个中性化的Service,用于管理配置信息、命名、提供分布式同步,还能组合Service。所有这些种类的Service都会在分布式应用程序中使用到。每次编写这些Service都会涉及大量的修bug和竞争情况。正因为这种编写这些Service有一定难度,所以通常都会忽视它们,这就使得在应用程序有变化时变得难以管理应用程序。即使处理得当,实现这些服务的不同方法也会使得部署应用程序变得难以管理。

虽然ZooKeeper是一个Java应用程序,但C也可以使用。这里就有个PHP的扩展,由Andrei Zmievski在2009创建并维护。你可以从PECL中下载,或从GitHub中直接获取PHP-ZooKeeper

要使用该扩展你首先要安装ZooKeeper。可以从官方网站下载。

[html] view plain copy
 
  1. $ tar zxfv zookeeper-3.4.8.tar.gz  
  2. $ cd zookeeper-3.4.8/src/c  
  3. $ ./configure --prefix=/usr/  
  4. $ make  
  5. $ sudo make install  


这样就会安装ZooKeeper的库和头文件。现在准备编译PHP扩展。

 

[html] view plain copy
 
  1. $ cd  
  2. $ git clone https://github.com/andreiz/php-zookeeper.git  
  3. $ cd php-zookeeper  
  4. $ phpize  
  5. $ ./configure  
  6. $ make  
  7. $ sudo make install  

将“zookeeper.so”添加到PHP配置中。

 

 

[html] view plain copy
 
  1. vim /etc/php5/cli/conf.d/20-zookeeper.ini  


因为我不需要运行在web服务环境下,所以这里我只编辑了CLI的配置。将下面的行复制到ini文件中。

 

 

[html] view plain copy
 
  1. extension=zookeeper.so  


使用如下命令来确定扩展是否已起作用。

 

 

[html] view plain copy
 
  1. $ php -m | grep zookeeper  
  2. zookeeper  


现在是时候运行ZooKeeper了。目前唯一还没有做的是配置。创建一个用于存放所有service数据的目录。

 

 

[html] view plain copy
 
  1. $ mkdir /home/you-account/zoo  
  2. $ cd  
  3. $ cd zookeeper-3.4.5/  
  4. $ cp conf/zoo_sample.cfg conf/zoo.cfg  
  5. $ vim conf/zoo.cfg  


找到名为“dataDir”的属性,将其指向“/home/you-account/zoo”目录。

 

 

[html] view plain copy
 
  1. $ bin/zkServer.sh start  
  2. $ bin/zkCli.sh -server 127.0.0.1:2181  
  3. [zk: 127.0.0.1:2181(CONNECTED) 14] create /test 1  
  4. Created /test  
  5. [zk: 127.0.0.1:2181(CONNECTED) 19] ls /  
  6. [test, zookeeper]  

 

 

此时,你已成功连到了ZooKeeper,并创建了一个名为“/test”的znode(稍后我们会用到)。ZooKeeper以树形结构保存数据。这很类似于文件系统,但“文件夹”(译者注:这里指非最底层的节点)又和文件很像。znode是ZooKeeper保存的实体。Node(节点)的说法很容易被混淆,所以为了避免混淆这里使用了znode。

因为我们稍后还会使用,所以这里我们让客户端保持连接状态。开启一个新窗口,并创建一个zookeeperdemo1.php文件。

 

[php] view plain copy
 
  1. <?php  
  2.    
  3. class ZookeeperDemo extends Zookeeper {  
  4.    
  5.   public function watcher( $i, $type, $key ) {  
  6.     echo "Insider Watcher\n";  
  7.    
  8.     // Watcher gets consumed so we need to set a new one  
  9.     $this->get( '/test', array($this, 'watcher' ) );  
  10.   }  
  11.    
  12. }  
  13.    
  14. $zoo = new ZookeeperDemo('127.0.0.1:2181');  
  15. $zoo->get( '/test', array($zoo, 'watcher' ) );  
  16.    
  17. while( true ) {  
  18.   echo '.';  
  19.   sleep(2);  
  20. }  

现在运行该脚本:

 

 

[html] view plain copy
 
  1. $ php zookeeperdemo1.php  


此处应该会每隔2秒产生一个点。现在切换到ZooKeeper客户端,并更新“/test”值。

 

 

[html] view plain copy
 
  1. [zk: 127.0.0.1:2181(CONNECTED) 20] set /test foo  

 

 

这样就会静默触发PHP脚本中的“Insider Watcher”消息。怎么会这样的?

ZooKeeper提供了可以绑定在znode的监视器。如果监视器发现znode发生变化,该service会立即通知所有相关的客户端。这就是PHP脚本如何知道变化的。Zookeeper::get方法的第二个参数是回调函数。当触发事件时,监视器会被消费掉,所以我们需要在回调函数中再次设置监视器。

现在你可以准备创建分布式应用程序了。其中的挑战是让这些独立的程序决定哪个(是leader)协调它们的工作,以及哪些(是worker)需要执行。这个处理过程叫做leader选举,在ZooKeeper Recipes and Solutions你能看到相关的实现方法。

这里简单来说就是,每个处理(或服务器)紧盯着相邻的那个处理(或服务器)。如果一个已被监视的处理(也即Leader)退出或者崩溃了,监视程序就会查找其相邻(此时最老)的那个处理作为Leader。

在真实的应用程序中,leader会给worker分配任务、监控进程和保存结果。这里为了简化,我跳过了这些部分。

创建一个新的PHP文件,命名为worker.php:

 

[html] view plain copy
 
  1. <?php  
  2.    
  3. class Worker extends Zookeeper {  
  4.    
  5.   const CONTAINER = '/cluster';  
  6.    
  7.   protected $acl = array(  
  8.                     array(  
  9.                       'perms' => Zookeeper::PERM_ALL,  
  10.                       'scheme' => 'world',  
  11.                       'id' => 'anyone' ) );  
  12.    
  13.   private $isLeader = false;  
  14.    
  15.   private $znode;  
  16.    
  17.   public function __construct( $host = '', $watcher_cb = null, $recv_timeout = 10000 ) {  
  18.     parent::__construct( $host, $watcher_cb, $recv_timeout );  
  19.   }  
  20.    
  21.   public function register() {  
  22.     if( ! $this->exists( self::CONTAINER ) ) {  
  23.       $this->create( self::CONTAINER, null, $this->acl );  
  24.     }  
  25.    
  26.     $this->znode = $this->create( self::CONTAINER . '/w-',  
  27.                                   null,  
  28.                                   $this->acl,  
  29.                                   Zookeeper::<span class="KSFIND_CLASS" id="0KSFindDIV">EPHEMER</span>AL | Zookeeper::SEQUENCE );  
  30.    
  31.     $this->znode = str_replace( self::CONTAINER .'/', '', $this->znode );  
  32.    
  33.     printf( "I'm registred as: %s\n", $this->znode );  
  34.    
  35.     $watching = $this->watchPrevious();  
  36.    
  37.     if( $watching == $this->znode ) {  
  38.       printf( "Nobody here, I'm the leader\n" );  
  39.       $this->setLeader( true );  
  40.     }  
  41.     else {  
  42.       printf( "I'm watching %s\n", $watching );  
  43.     }  
  44.   }  
  45.    
  46.   public function watchPrevious() {  
  47.     $workers = $this->getChildren( self::CONTAINER );  
  48.     sort( $workers );  
  49.     $size = sizeof( $workers );  
  50.     for( $i = 0 ; $i < $size ; $i++ ) {  
  51.       if( $this->znode == $workers[ $i ] ) {  
  52.         if( $i > 0 ) {  
  53.           $this->get( self::CONTAINER . '/' . $workers[ $i - 1 ], array( $this, 'watchNode' ) );  
  54.           return $workers[ $i - 1 ];  
  55.         }  
  56.    
  57.         return $workers[ $i ];  
  58.       }  
  59.     }  
  60.    
  61.     throw new Exception(  sprintf( "Something went very wrong! I can't find myself: %s/%s",  
  62.                           self::CONTAINER,  
  63.                           $this->znode ) );  
  64.   }  
  65.    
  66.   public function watchNode( $i, $type, $name ) {  
  67.     $watching = $this->watchPrevious();  
  68.     if( $watching == $this->znode ) {  
  69.       printf( "I'm the new leader!\n" );  
  70.       $this->setLeader( true );  
  71.     }  
  72.     else {  
  73.       printf( "Now I'm watching %s\n", $watching );  
  74.     }  
  75.   }  
  76.    
  77.   public function isLeader() {  
  78.     return $this->isLeader;  
  79.   }  
  80.    
  81.   public function setLeader($flag) {  
  82.     $this->isLeader = $flag;  
  83.   }  
  84.    
  85.   public function run() {  
  86.     $this->register();  
  87.    
  88.     while( true ) {  
  89.       if( $this->isLeader() ) {  
  90.         $this->doLeaderJob();  
  91.     }  
  92.     else {  
  93.       $this->doWorkerJob();  
  94.     }  
  95.    
  96.       sleep( 2 );  
  97.     }  
  98.   }  
  99.    
  100.   public function doLeaderJob() {  
  101.     echo "Leading\n";  
  102.   }  
  103.    
  104.   public function doWorkerJob() {  
  105.     echo "Working\n";  
  106.   }  
  107.    
  108. }  
  109.    
  110. $worker = new Worker( '127.0.0.1:2181' );  
  111. $worker->run();  


打开至少3个终端,在每个终端中运行以下脚本:

 

 

[html] view plain copy
 
  1. # term1  
  2.    
  3. $ php worker.php  
  4. I'm registred as: w-0000000001  
  5. Nobody here, I'm the leader  
  6. Leading  
  7.    
  8. # term2  
  9.    
  10. $ php worker.php  
  11. I'm registred as: w-0000000002  
  12. I'm watching w-0000000001  
  13. Working  
  14.    
  15. # term3  
  16.    
  17. $ php worker.php  
  18. I'm registred as: w-0000000003  
  19. I'm watching w-0000000002  
  20. Working  

 

 

现在模拟Leader崩溃的情形。使用Ctrl+c或其他方法退出第一个脚本。刚开始不会有任何变化,worker可以继续工作。后来,ZooKeeper会发现超时,并选举出新的leader。

虽然这些脚本很容易理解,但是还是有必要对已使用的Zookeeper标志作注释:

 

[html] view plain copy
 
  1. $this->znode = $this->create( self::CONTAINER . '/w-',  
  2.                               null,  
  3.                               $this->acl,  
  4.                               Zookeeper::EPHEMERAL | Zookeeper::SEQUENCE );  

 

 

每个znode都是EPHEMERAL和SEQUENCE的。

EPHEMRAL代表当客户端失去连接时移除该znode。这就是为何PHP脚本会知道超时。SEQUENCE代表在每个znode名称后添加顺序标识。我们通过这些唯一标识来标记worker。

在PHP部分还有些问题要注意。该扩展目前还是beta版,如果使用不当很容易发生segmentation fault。比如,不能传入普通函数作为回调函数,传入的必须为方法。我希望更多PHP社区的同仁可以看到Apache ZooKeeper的好,同时该扩展也会获得更多的支持。

ZooKeeper是一个强大的软件,拥有简洁和简单的API。由于文档和示例都做的很好,任何人都可以很容易的编写分布式软件。让我们开始吧,这会很有趣的。

相关连接:
Yahoo research on ZooKeeper. 非常好的阅读材料,拥有真实的应用程序示例。如果你只要阅读一份ZooKeeper的资料,那么就是这份了。

PHP ZooKeeper

PHP ZooKeeper API

PHP ZooKeeper example

 

posted @ 2018-04-12 10:33  默默地前进  阅读(194)  评论(0编辑  收藏  举报