07 HBase操作

8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据

9.对比HBase列式表与MySQL的行式表

  • 在HBase中创建学生课程分数表student并查看表结构。create,describe,put,alter
  • 在mysql中创建学生表student, 课程表 course, 分数表score并查看表结构。
  • 分别插入几行数据,几个版本。put/insert
  • 查看数据及版本。get,scan/select

1. 利用Shell命令
1.1 HBase中创建表

HBase中用create命令创建表,具体如下:

      create 'student','Sname','Ssex','Sage','Sdept','course'

Shell 命令

命令执行截图如下:

此时,即创建了一个“student”表,属性有:Sname,Ssex,Sage,Sdept,course。因为HBase的表中会有一个系统默认的属性作为行键,无需自行创建,默认为put命令操作中表名后第一个数据。创建完“student”表后,可通过describe命令查看“student”表的基本信息。命令执行截图如下:
1.2 HBase数据库基本操作

本小节主要介绍HBase的增、删、改、查操作。在添加数据时,HBase会自动为添加的数据添加一个时间戳,故在需要修改数据时,只需直接添加数据,HBase即会生成一个新的版本,从而完成“改”操作,旧的版本依旧保留,系统会定时回收垃圾数据,只留下最新的几个版本,保存的版本数可以在创建表的时候指定。

    添加数据
    HBase中用put命令添加数据,注意:一次只能为一个表的一行数据的一个列,也就是一个单元格添加一个数据,所以直接用shell命令插入数据效率很低,在实际应用中,一般都是利用编程操作数据。
    当运行命令:put ‘student’,’95001’,’Sname’,’LiYing’时,即为student表添加了学号为95001,名字为LiYing的一行数据,其行键为95001。

    put 'student','95001','Sname','LiYing'

Shell 命令

命令执行截图如下,即为student表添加了学号为95001,名字为LiYing的一行数据,其行键为95001。
插入数据

      put 'student','95001','course:math','80'

Shell 命令

命令执行截图如下,即为95001行下的course列族的math列添加了一个数据。

    删除数据

在HBase中用delete以及deleteall命令进行删除数据操作,它们的区别是:1. delete用于删除一个数据,是put的反向操作;2. deleteall操作用于删除一行数据。

1. delete命令

      delete 'student','95001','Ssex'

Shell 命令

命令执行截图如下, 即删除了student表中95001行下的Ssex列的所有数据。

2. deleteall命令

      deleteall 'student','95001'

Shell 命令

命令执行截图如下,即删除了student表中的95001行的全部数据。

    查看数据
    HBase中有两个用于查看数据的命令:1. get命令,用于查看表的某一行数据;2. scan命令用于查看某个表的全部数据

1. get命令

      get 'student','95001'

Shell 命令

命令执行截图如下, 返回的是‘student’表‘95001’行的数据。

2. scan命令

      scan 'student'

Shell 命令

命令执行截图如下, 返回的是‘student’表的全部数据。

    删除表
    删除表有两步,第一步先让该表不可用,第二步删除表。

    disable 'student'  
    drop 'student'

Shell 命令

命令执行截图如下:
删除表
1.3 查询表历史数据

查询表的历史版本,需要两步。
1、在创建表的时候,指定保存的版本数(假设指定为5)

      create 'teacher',{NAME=>'username',VERSIONS=>5}

Shell 命令

2、插入数据然后更新数据,使其产生历史版本数据,注意:这里插入数据和更新数据都是用put命令

    put 'teacher','91001','username','Mary'
    put 'teacher','91001','username','Mary1'
    put 'teacher','91001','username','Mary2'
    put 'teacher','91001','username','Mary3'
    put 'teacher','91001','username','Mary4'  
    put 'teacher','91001','username','Mary5'

Shell 命令

3、查询时,指定查询的历史版本数。默认会查询出最新的数据。(有效取值为1到5)

      get 'teacher','91001',{COLUMN=>'username',VERSIONS=>5}

Shell 命令

查询结果截图如下:
查看历史数据
1.4 退出HBase数据库表操作

最后退出数据库操作,输入exit命令即可退出,注意:这里退出HBase数据库是退出对数据库表的操作,而不是停止启动HBase数据库后台运行。


 

1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。

表:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族。
行:每个HBase表都由若干行组成,每个行由行键(row key)来标识。
列族:一个HBase表被分组成许多“列族”(Column Family)的集合,它是基本的访问控制单元。
列限定符:列族里的数据通过列限定符(或列)来定位。
单元格:在HBase表中,通过行、列族和列限定符确定一个“单元格”(cell),单元格中存储的数据没有数据类型,总被视为字节数组byte[]。
时间戳:每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引。

2.启动HDFS,启动HBase,进入HBaseShell命令行,列出HBase中所有的表信息list

 

 

 

 

 

 

posted @ 2021-11-16 15:44  olino  阅读(681)  评论(0编辑  收藏  举报