第七次作业

1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。

HBase 是一个稀疏、多维度、有序的映射表。

这张表中每个单元是通过由行键、列族、列限定符和时间戳组成的索引来标识的。

行键是行的唯一标识,行键并没有什么特定的数据类型,以二进制的字节来存储,按字母顺序排序。

在定义 HBase 表的时候需要提前设置好列族,表中所有的列都需要组织在列族里面。列族一旦确定后,就不能轻易修改,因为它会影响到 HBase 真实的物理存储结构,但是列族中的列限定符及其对应的值可以动态增删。

列族中的数据通过列限定符来进行映射。列限定符不需要事先定义,也不需要在不同行之间保持一致。列限定符没有特定的数据类型,以二进制字节来存储。

默认情况下,每一个单元中的数据插入时都会用时间戳来进行版本标识。

2.启动HDFS,启动HBase,进入HBaseShell命令行。

 

 

 

 

 

 

3.列出HBase中所有的表信息list

4.创建表create

5.查看表详情desc

6.插入数据put

7.查看表数据scan

 

 8、分别用MySQL和HBase创建以下表:

 (1)在HBase上创建表lyr-student

 (2)在数据库上创建表lyr-student

 

 

8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据

①创建表格t1,设置列族f1、f2,f2版本设置为3。

②修改f1的版本为5.

③插入数据

④查看多版本数据

 

9.对比HBase列式表与MySQL的行式表

  • 在HBase中创建学生课程分数表student并查看表结构。create,describe,put
  • 在mysql中创建学生表student, 课程表 course, 分数表score并查看表结构。create,describe
  • 分别插入几行数据,几个版本。put/insert
  • 查看数据及版本。get,scan/select

①创建学生课程分数表student并查看表结构。

 

 ②插入数据及不同的版本。

 

 

 

 

 

 

 

 查看

posted on 2021-11-12 18:15  KeyGG  阅读(82)  评论(0编辑  收藏  举报

导航