第七次作业
1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。
HBase 是一个稀疏、多维度、有序的映射表。
这张表中每个单元是通过由行键、列族、列限定符和时间戳组成的索引来标识的。
行键是行的唯一标识,行键并没有什么特定的数据类型,以二进制的字节来存储,按字母顺序排序。
在定义 HBase 表的时候需要提前设置好列族,表中所有的列都需要组织在列族里面。列族一旦确定后,就不能轻易修改,因为它会影响到 HBase 真实的物理存储结构,但是列族中的列限定符及其对应的值可以动态增删。
列族中的数据通过列限定符来进行映射。列限定符不需要事先定义,也不需要在不同行之间保持一致。列限定符没有特定的数据类型,以二进制字节来存储。
默认情况下,每一个单元中的数据插入时都会用时间戳来进行版本标识。
2.启动HDFS,启动HBase,进入HBaseShell命令行。
3.列出HBase中所有的表信息list
4.创建表create
5.查看表详情desc
6.插入数据put
7.查看表数据scan
8、分别用MySQL和HBase创建以下表:
(1)在HBase上创建表lyr-student
(2)在数据库上创建表lyr-student
8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据
①创建表格t1,设置列族f1、f2,f2版本设置为3。
②修改f1的版本为5.
③插入数据
④查看多版本数据
9.对比HBase列式表与MySQL的行式表
- 在HBase中创建学生课程分数表student并查看表结构。create,describe,put
- 在mysql中创建学生表student, 课程表 course, 分数表score并查看表结构。create,describe
- 分别插入几行数据,几个版本。put/insert
- 查看数据及版本。get,scan/select
①创建学生课程分数表student并查看表结构。
②插入数据及不同的版本。
查看