有人说过“让Hadoop开发像家庭作业一样简单”,容器技术的出现让这成为可能,可以用Docker封装HBase运行环境,通过统一的接口来运行。本文将介绍如何在十分钟内跑起你的HBase应用。

首先,我们需要安装HBase集群来开发和测试,下载HBase源码运行单机版固然可以,前提是你已经安装配置好Java和Maven环境,或者你可以运行命令docker run -d --net=host tobegit3hub/standalone-hbase-0.94

这个命令会下载名为standalone-hbase-0.94的Docker镜像,以Daemon形式运行。具体它做了什么呢?可以查看它的Dockerfile,原来就是安装Java7、下载HBase源码、然后编译和运行单机版HBase。如果镜像已经下载,只需几秒钟就可以创建干净的HBase开发环境了。

然后,我们可以编写HBase应用了,我已经开发了一个smoke-hbase的程序,它会在本地的HBase集群创建表、插入数据、读数据、删除数据和删除表。怎么运行呢?也是一行命令docker run -i -t --net=host tobegit3hub/smoke-hbase

运行结果如下,不管你在什么系统执行,Docker可以保证运行结果是Repeatable和Predictable的。

 

不管你对Docker是否感冒,强烈建议运行上面两条命令,你只需安装Docker就可以了。Ubuntu通过apt-get install docker.io安装,CentOS可以执行yum install docker,Mac用户只要下载boot2docker即可。

最后还有一个问题,如何修改应用的代码?一种方式是直接进入Docker容器修改,这样就只能在tty(命令行)操作了,另一种方式是使用Docker的volume特性。例如执行docker run -i -t --net=host --privileged -v /:/host tobegit3hub/jde,这会创建一个安装好Java7和Maven的开发环境,你使用IDE修改完代码后,Docker容器能直接读本地文件系统的代码,然后在容器内运行你的应用就可以了。