06 HBase安装与伪分布式配置

1.下载压缩文件

2.解压

3.修改文件夹名

4.修改文件夹权限

5.配置环境变量

6.伪分布式配置文件

7.启动HDFS,启动Hbase

8.进入shell界面

9.停止Hbase,停止HDFS运行


 1. HBase2.2.2安装

点击下面的地址下载HBase2.2.2安装文件HBase官网下载地址
也可以直接点击这里从百度云盘下载软件(提取码:ziyu)。进入百度网盘后,进入“软件”目录,找到hbase-2.2.2-bin.tar.gz文件,下载到本地。

1.1 解压安装包hbase-2.2.2-bin.tar.gz至路径 /usr/local,命令如下:

    cd ~
    sudo tar -zxf ~/下载/hbase-2.2.2-bin.tar.gz -C /usr/local

Shell 命令

1.2 将解压的文件名hbase-2.2.2改为hbase,以方便使用,命令如下:

    cd /usr/local
    sudo mv ./hbase-2.2.2 ./hbase

Shell 命令

下面把hbase目录权限赋予给hadoop用户:

    cd /usr/local
    sudo chown -R hadoop ./hbase

Shell 命令

1.3 配置环境变量
将hbase下的bin目录添加到path中,这样,启动hbase就无需到/usr/local/hbase目录下,大大的方便了hbase的使用。教程下面的部分还是切换到了/usr/local/hbase目录操作,有助于初学者理解运行过程,熟练之后可以不必切换。
编辑~/.bashrc文件

    vim ~/.bashrc

Shell 命令

如果没有引入过PATH请在~/.bashrc文件尾行添加如下内容:

    export PATH=$PATH:/usr/local/hbase/bin

Shell

如果已经引入过PATH请在export PATH这行追加/usr/local/hbase/bin,这里的“:”是分隔符。如下图:
配置环境变量
编辑完成后,再执行source命令使上述配置在当前终端立即生效,命令如下:

    source ~/.bashrc

Shell 命令

扩展阅读: 设置Linux环境变量的方法和区别
1.4 添加HBase权限

    cd /usr/local
    sudo chown -R hadoop ./hbase       #将hbase下的所有文件的所有者改为hadoop,hadoop是当前用户的用户名。

Shell 命令

1.5 查看HBase版本,确定hbase安装成功,命令如下:

    /usr/local/hbase/bin/hbase version

Shell 命令

看到输出版本消息表示HBase已经安装成功,接下来将分别进行HBase单机模式和伪分布式模式的配置。
2. HBase配置

HBase有三种运行模式,单机模式、伪分布式模式、分布式模式。作为学习,我们重点讨论单机模式和伪分布式模式。
以下先决条件很重要,比如没有配置JAVA_HOME环境变量,就会报错。
– jdk
– Hadoop( 单机模式不需要,伪分布式模式和分布式模式需要)
– SSH

以上三者如果没有安装,请回到Hadoop3.1.3的安装参考如何安装。
2.1单机模式配置

1. 配置/usr/local/hbase/conf/hbase-env.sh 。配置JAVA环境变量,并添加配置HBASE_MANAGES_ZK为true,用vi命令打开并编辑hbase-env.sh,命令如下:

    vim /usr/local/hbase/conf/hbase-env.sh

Shell 命令

配置JAVA环境变量。如果你之前已经按照本网站Hadoop安装教程安装Hadoop3.1.3,则已经安装了JDK1.8。JDK的安装目录是/usr/lib/jvm/jdk1.8.0_162, 则JAVA _HOME =/usr/lib/jvm/jdk1.8.0_162;配置HBASE_MANAGES_ZK为true,表示由hbase自己管理zookeeper,不需要单独的zookeeper。hbase-env.sh中本来就存在这些变量的配置,大家只需要删除前面的#并修改配置内容即可(#代表注释):

    export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
    export HBASE_MANAGES_ZK=true

Shell

添加完成后保存退出即可。

2. 配置/usr/local/hbase/conf/hbase-site.xml
打开并编辑hbase-site.xml,命令如下:

    vim /usr/local/hbase/conf/hbase-site.xml

Shell 命令

在启动HBase前需要设置属性hbase.rootdir,用于指定HBase数据的存储位置,因为如果不设置的话,hbase.rootdir默认为/tmp/hbase-${user.name},这意味着每次重启系统都会丢失数据。此处设置为HBase安装目录下的hbase-tmp文件夹即(/usr/local/hbase/hbase-tmp),添加配置如下:

    <configuration>
            <property>
                    <name>hbase.rootdir</name>
                    <value>file:///usr/local/hbase/hbase-tmp</value>
            </property>
    </configuration>

XML

3. 接下来测试运行。首先切换目录至HBase安装目录/usr/local/hbase;再启动HBase。命令如下:

    cd /usr/local/hbase
    bin/start-hbase.sh
    bin/hbase shell

Shell 命令

上述三条命令中,sudo bin/start-hbase.sh用于启动HBase,bin/hbase shell用于打开shell命令行模式,用户可以通过输入shell命令操作HBase数据库。
成功启动HBase,截图如下:

停止HBase运行,命令如下:

    bin/stop-hbase.sh

Shell 命令

注意:如果在操作HBase的过程中发生错误,可以通过{HBASE_HOME}目录(/usr/local/hbase)下的logs子目录中的日志文件查看错误原因。
2.2 伪分布式模式配置

1.配置/usr/local/hbase/conf/hbase-env.sh。命令如下:

    vim /usr/local/hbase/conf/hbase-env.sh

Shell 命令

配置JAVA_HOME,HBASE_CLASSPATH,HBASE_MANAGES_ZK.
HBASE_CLASSPATH设置为本机HBase安装目录下的conf目录(即/usr/local/hbase/conf)

    export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
    export HBASE_CLASSPATH=/usr/local/hbase/conf
    export HBASE_MANAGES_ZK=true

Shell

2.配置/usr/local/hbase/conf/hbase-site.xml
用命令vi打开并编辑hbase-site.xml,命令如下:

    vim /usr/local/hbase/conf/hbase-site.xml

Shell 命令

修改hbase.rootdir,指定HBase数据在HDFS上的存储路径;将属性hbase.cluter.distributed设置为true。假设当前Hadoop集群运行在伪分布式模式下,在本机上运行,且NameNode运行在9000端口。

    <configuration>
            <property>
                    <name>hbase.rootdir</name>
                    <value>hdfs://localhost:9000/hbase</value>
            </property>
            <property>
                    <name>hbase.cluster.distributed</name>
                    <value>true</value>
            </property>
            <property>
            <name>hbase.unsafe.stream.capability.enforce</name>
            <value>false</value>
        </property>
    </configuration>

XML

hbase.rootdir指定HBase的存储目录;hbase.cluster.distributed设置集群处于分布式模式.
另外,上面配置文件中,hbase.unsafe.stream.capability.enforce这个属性的设置,是为了避免出现启动错误。也就是说,如果没有设置hbase.unsafe.stream.capability.enforce为false,那么,在启动HBase以后,会出现无法找到HMaster进程的错误,启动后查看系统启动日志(/usr/local/hbase/logs/hbase-hadoop-master-ubuntu.log),会发现如下错误:

2020-01-25 15:04:56,916 ERROR [master/localhost:16000:becomeActiveMaster] master.HMaster: Failed to become active master
java.lang.IllegalStateException: The procedure WAL relies on the ability to hsync for proper operation during component failures, but the underlying filesystem does not support doing so. Please check the config value of 'hbase.procedure.store.wal.use.hsync' to set the desired level of robustness and ensure the config value of 'hbase.wal.dir' points to a FileSystem mount that can provide it.

3. 接下来测试运行HBase。
第一步:首先登陆ssh,之前设置了无密码登陆,因此这里不需要密码;再切换目录至/usr/local/hadoop ;再启动hadoop,如果已经启动hadoop请跳过此步骤。命令如下:

    ssh localhost
    cd /usr/local/hadoop
    ./sbin/start-dfs.sh

Shell 命令

输入命令jps,能看到NameNode,DataNode和SecondaryNameNode都已经成功启动,表示hadoop启动成功,截图如下:
hadoop jps

第二步:切换目录至/usr/local/hbase;再启动HBase.命令如下:

    cd /usr/local/hbase
    bin/start-hbase.sh

Shell 命令

启动成功,输入命令jps,看到以下界面说明hbase启动成功
hbase jps
进入shell界面:

    bin/hbase shell

Shell 命令

截图如下:
hbase shell

4.停止HBase运行,命令如下:

    bin/stop-hbase.sh

Shell 命令

注意:如果在操作HBase的过程中发生错误,可以通过{HBASE_HOME}目录(/usr/local/hbase)下的logs子目录中的日志文件查看错误原因。
这里启动关闭Hadoop和HBase的顺序一定是:
启动Hadoop—>启动HBase—>关闭HBase—>关闭Hadoop
三、 编程实践
1. 利用Shell命令
1.1 HBase中创建表

HBase中用create命令创建表,具体如下:

      create 'student','Sname','Ssex','Sage','Sdept','course'

Shell 命令

命令执行截图如下:

此时,即创建了一个“student”表,属性有:Sname,Ssex,Sage,Sdept,course。因为HBase的表中会有一个系统默认的属性作为行键,无需自行创建,默认为put命令操作中表名后第一个数据。创建完“student”表后,可通过describe命令查看“student”表的基本信息。命令执行截图如下:
1.2 HBase数据库基本操作

本小节主要介绍HBase的增、删、改、查操作。在添加数据时,HBase会自动为添加的数据添加一个时间戳,故在需要修改数据时,只需直接添加数据,HBase即会生成一个新的版本,从而完成“改”操作,旧的版本依旧保留,系统会定时回收垃圾数据,只留下最新的几个版本,保存的版本数可以在创建表的时候指定。

    添加数据
    HBase中用put命令添加数据,注意:一次只能为一个表的一行数据的一个列,也就是一个单元格添加一个数据,所以直接用shell命令插入数据效率很低,在实际应用中,一般都是利用编程操作数据。
    当运行命令:put ‘student’,’95001’,’Sname’,’LiYing’时,即为student表添加了学号为95001,名字为LiYing的一行数据,其行键为95001。

    put 'student','95001','Sname','LiYing'

Shell 命令

命令执行截图如下,即为student表添加了学号为95001,名字为LiYing的一行数据,其行键为95001。
插入数据

      put 'student','95001','course:math','80'

Shell 命令

命令执行截图如下,即为95001行下的course列族的math列添加了一个数据。

    删除数据

在HBase中用delete以及deleteall命令进行删除数据操作,它们的区别是:1. delete用于删除一个数据,是put的反向操作;2. deleteall操作用于删除一行数据。

1. delete命令

      delete 'student','95001','Ssex'

Shell 命令

命令执行截图如下, 即删除了student表中95001行下的Ssex列的所有数据。

2. deleteall命令

      deleteall 'student','95001'

Shell 命令

命令执行截图如下,即删除了student表中的95001行的全部数据。

    查看数据
    HBase中有两个用于查看数据的命令:1. get命令,用于查看表的某一行数据;2. scan命令用于查看某个表的全部数据

1. get命令

      get 'student','95001'

Shell 命令

命令执行截图如下, 返回的是‘student’表‘95001’行的数据。

2. scan命令

      scan 'student'

Shell 命令

命令执行截图如下, 返回的是‘student’表的全部数据。

    删除表
    删除表有两步,第一步先让该表不可用,第二步删除表。

    disable 'student'  
    drop 'student'

Shell 命令

命令执行截图如下:
删除表
1.3 查询表历史数据

查询表的历史版本,需要两步。
1、在创建表的时候,指定保存的版本数(假设指定为5)

      create 'teacher',{NAME=>'username',VERSIONS=>5}

Shell 命令

2、插入数据然后更新数据,使其产生历史版本数据,注意:这里插入数据和更新数据都是用put命令

    put 'teacher','91001','username','Mary'
    put 'teacher','91001','username','Mary1'
    put 'teacher','91001','username','Mary2'
    put 'teacher','91001','username','Mary3'
    put 'teacher','91001','username','Mary4'  
    put 'teacher','91001','username','Mary5'

Shell 命令

3、查询时,指定查询的历史版本数。默认会查询出最新的数据。(有效取值为1到5)

      get 'teacher','91001',{COLUMN=>'username',VERSIONS=>5}

Shell 命令

查询结果截图如下:
查看历史数据
1.4 退出HBase数据库表操作

最后退出数据库操作,输入exit命令即可退出,注意:这里退出HBase数据库是退出对数据库表的操作,而不是停止启动HBase数据库后台运行。


 

1.下载压缩文件

2.解压

 

 

3.修改文件夹名

 

 

4.修改文件夹权限

 

 

5.配置环境变量

 

 

6.伪分布式配置文件

 

 

 

 

7.启动HDFS,启动Hbase

 

 

8.进入shell界面

 

 

9.停止Hbase,停止HDFS运行

 

07 HBase操作

1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。

2.启动HDFS,启动HBase,进入HBaseShell命令行。

3.列出HBase中所有的表信息list

4.创建表create

5.查看表详情desc

 

6.插入数据put

 

 

7.查看表数据scan

 

课件资源链接: https://pan.baidu.com/s/1YhiGBudtYMp_CdGm_x7ORQ 提取码: 4p6r 

 

尝试分别用MySQL和HBase创建以下表:

 

 

8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据

9.对比HBase列式表与MySQL的行式表

  • 在HBase中创建学生课程分数表student并查看表结构。create,describe,put,alter
  • 在mysql中创建学生表student, 课程表 course, 分数表score并查看表结构。
  •  并查看表结构。

     

     

     

     

     

  • 分别插入几行数据,几个版本。put/insert
  •  

     

  • 查看数据及版本。get,scan/select
  •  

posted @ 2021-11-05 08:40  olino  阅读(140)  评论(0编辑  收藏  举报