07 HBase操作
1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。
表:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族
行:每个HBase表都由若干行组成,每个行由行键来标识
列族:一个HBase表被分组成许多列族的集合,它是基本的访问控制单元
列限定符:列族里的数据通过列限定符,或列来定位
单元格:在HBase表中,通过行、列族和列限定符确定一个“单元格”,单元格中存储的数据没有数据类型,总被视为字节数组
时间戳:每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳来进行索引。
2.启动HDFS,启动HBase,进入HBaseShell命令行。
3.列出HBase中所有的表信息list
4.创建表create
5.查看表详情desc
6.插入数据put
7.查看表数据scan,get
scan:浏览表的相关信息
get:通过表名、行、列、时间戳、时间范围和版本号来获得相应单元格的值。
1)从tempTable中,获取第r1行、第“f1:c1”列的值
2)从tempTable中,获取第r1行、第“f1:c3”列的值
8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据
1)创建
2)改变版本号
3)插入数据,并查看
9.对比HBase列式表与MySQL的行式表
- 在HBase中创建学生课程分数表student并查看表结构。create,describe,pu
- 在mysql中创建学生表student, 课程表 course, 分数表score并查看表结构。create,describe
- 分别插入几行数据,几个版本。put/insert
- 查看数据及版本。get,scan/select
MySQL:
1)创建学生表student,插入数据并查看
2)创建课程表,插入数据并查看
3)创建课程成绩表,插入数据并查看
HBase:
(2)插入数据