HBase-0.90.4集群安装配置-Standalone

HBase是Hadoop数据库,能够实现随机、实时读写你的Big Data,它是Google的Bigtable的开源实现,可以参考Bigtable的论文Bigtable: A Distributed Storage System for Structured
。HBase的存储模型可以如下三个词来概括:distributed, versioned, column-oriented。HBase并非只能在HDFS文件系统上使用, 你可以应用在你的本地文件系统上部署HBase实例来存储数据。

准备工作

hbase-0.90.4.tar.gz [http://labs.renren.com/apache-mirror//hbase/stable/hbase-0.90.4.tar.gz]
zookeeper-3.3.4.tar.gz
下面介绍Standalone和Distributed安装过程。

Standalone模式

这种安装模式,是在你的本地文件系统上安装配置一个HBase实例,安装配置比较简单。

首先,要保证你的本地系统能够通过ssh无密码访问,配置如下:

ssh-keygen -t dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
检查一下权限:你的~/.ssh目录的权限是否为755,~/.ssh/authorized_keys的权限是否为644,如果不是,执行下面的命令行:
chmod 755 ~/.ssh
chmod 644 ~/.ssh/authorized_keys
然后,安装配置HBase,过程如下:
cd /home/shirdrn/Hadoop
tar -xvzf hbase-0.90.4.tar.gz
cd hbase-0.90.4
修改conf/hbase-env.sh中JAVA_HOME配置,指定为你的JAVA_HOME目录:
export JAVA_HOME=/usr/java/jdk1.6.0_16
其他配置,如HBASE*指定配置项,如果需要可以进行配置。
修改hbase-site.xml中配置,示例如下:


hbase.rootdir
file:///home/shirdrn/Hadoop/hbase-0.90.4/data

指定HBase的数据存储目录,使用的是本地文件系统的目录。
接着,就可以启动HBase实例,提供本地存储服务:

bin/start-hbase.sh
启动完成以后,你可以跟踪一下HBase日志,看看是否启动成功了:
tail -500f logs/hbase-shirdrn-master-localhost.log
或者查看一下HMaster进程是否存在:
ps -ef | grep HMaster
通过日志可以看出,HBase实例启动了所有的HBase和Zookeeper守护进程,并且这些进程都是在同一个JVM中。下面,可以启动HBase shell,来简单测试HBase的数据存储的基本命令:

cd bin
hbase shell
hbase(main):001:0> help
hbase(main):002:0> status
hbase(main):003:0> version
// 创建表'pagedb',列簇(Column Family)为metadata、text、status
hbase(main):004:0> create 'pagedb', 'metadata', 'text', 'status'
// 插入数据
hbase(main):005:0> put 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'metadata:site', 'www.mafengwo.cn'
hbase(main):006:0> put 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'metadata:pubdate', '2011-12-20 22:09'
hbase(main):007:0> put 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'text:title', '南国之境'
hbase(main):008:0> put 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'text:content', '如果海會說话, 如果風愛上砂 我會聆聽浪花,...'
hbase(main):009:0> put 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'status:extracted', '0'
hbase(main):010:0> put 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'status:httpcode', '200'
hbase(main):011:0> put 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'status:indexed', '1'
// 扫描表'pagedb'
hbase(main):012:0> scan 'pagedb'
// 获取记录'http://www.mafengwo.cn/i/764197.html'的所有列的数据
hbase(main):013:0> get 'pagedb', 'http://www.mafengwo.cn/i/764197.html'
// 获取记录'http://www.mafengwo.cn/i/764197.html'的metadata列簇数据
hbase(main):014:0> get 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'metadata'
// 获取记录'http://www.mafengwo.cn/i/764197.html'的列metadata:site数据
hbase(main):015:0> get 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'metadata:site'
// 增加一个列status:state,并指定值为4
hbase(main):016:0> incr 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'status:state', 4
// 修改status:httpcode的值为500
hbase(main):017:0> put 'pagedb', 'http://www.mafengwo.cn/i/764197.html', 'status:httpcode', '500'
// 统计表'pagedb'中的记录行数
hbase(main):018:0> count 'pagedb'
// disable表'pagedb'
hbase(main):019:0> disable 'pagedb'
// enable表pagedb
hbase(main):020:0> enable 'pagedb'
// 清空表'pagedb'
hbase(main):021:0> truncate 'pagedb'
// 列出所有表
hbase(main):022:0> list
// 删除'http://www.mafengwo.cn/i/764197.html'数据行
hbase(main):023:0> deleteall 'pagedb','http://www.mafengwo.cn/i/764197.html'
// 删除表'pagedb',删除之前必须先disable表
hbase(main):024:0> drop 'pagedb'
如果想练习使用其他更多命令,可以通过help查看其他命令。

posted on 2012-05-11 23:33  powerXu  阅读(652)  评论(0编辑  收藏  举报