HBase的简介、HBase的搭建、重置HBase、HBase日志文件所在的目录、进入/退出HBase的shell、HBase的web界面
HBase的简介
-
HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库
面向列 -- 面向列族
HBase中的数据是 K-V 格式的 其中
K --
rowkey(rk)
V 是由很多部分构成的,其中就有
Column Family
(列族 简称 CF)而列族是由
qualifier
(列)组成的半结构化 -- 每一行数据的格式可能不一样
-
利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为其分布式协同服务
HBase有自己专属的一种数据格式
HFile
元数据存储在 Zookeeper 上
数据存储在 HDFS 上
-
主要用来存储非结构化和半结构化的松散数据(列存储 NoSQL 数据库)
-
HBase也是主从架构
主节点 --
HMaster
从节点 --
HRegionServer
HBase的搭建
时间要同步
yum install ntp -y
1、启动Hadoop
start-all.sh
// 验证
1、通过HDFS的web界面
http://master:50070
2、查看进程
jps
2、启动zookeeper
// 需要在在三台中分别启动
zkServer.sh start
// 查看状态
zkServer.sh status
3、搭建HBase
4、上传并解压
// 通过Xftp上传
cd /usr/local/module
// 解压
tar -zxvf /usr/local/module/hbase-1.4.6-bin.tar.gz -C /usr/local/soft/
5、配置环境变量
vim /etc/profile
HBASE_HOME=/usr/local/soft/hbase-1.4.6
export PATH=$HBASE_HOME/bin:$PATH
source /etc/profile
6、修改配置文件
/usr/local/soft/hbase-1.4.6/conf
// hbase-env.sh
// 增加java配置
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171
// 关闭默认原生自带的zk配置
export HBASE_MANAGES_ZK=false
// hbase-site.xml
<property>
// HBase在HDFS上的存储路径
<name>hbase.rootdir</name>
<value>hdfs://master:9000/hbase</value>
</property>
<property>
// 设置HBase为集群模式
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
// 设置Zookeeper的三个节点
<name>hbase.zookeeper.quorum</name>
<value>node1,node2,master</value>
</property>
// regionservers
// 增加
node1
node2
7、同步到所有节点(如果是伪分布式不需要同步)
scp -r hbase-1.4.6/ node1:`pwd`
scp -r hbase-1.4.6/ node2:`pwd`
8、启动/停止 hbase 集群
在主节点master 启动/停止 即可
第一次启动需要等HBASE初始化一会
// 启动
start-hbase.sh
// 停止
stop-hbase.sh
9、通过HBase的web界面 验证hbase
master:16010
重置hbase
hbase 搭建失败了 不知道问题出在哪里
1、关闭hbase集群
stop-hbase.sh
2、删除数据 hdfs
hdfs dfs -rmr /hbase
3、删除元数据 zk
zkCli.sh
rmr /hbase
4、重新启动hbase
start-hbase.sh
// 注意时间要同步
yum install ntp -y
HBase日志文件所在的目录
/usr/local/soft/hbase-1.4.6/logs
进入/退出HBase的shell
// 进入
hbase shell
// 退出
exit
HBase的web界面
master:16010