07 HBase操作
1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。
2.启动HDFS,启动HBase,进入HBaseShell命令行。
3.列出HBase中所有的表信息list
4.创建表create
5.查看表详情desc
6.插入数据put
7.查看表数据scan
1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。
表:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族。
行:每个HBase表都由若干行组成,每个行由行键(row key)来标识。
列族:一个HBase表被分组成许多“列族”(Column Family)的集合,它是基本的访问控制单元。
列限定符:列族里的数据通过列限定符(或列)来定位。
单元格:在HBase表中,通过行、列族和列限定符确定一个“单元格”(cell),单元格中存储的数据没有数据类型,总被视为字节数组byte[]。
时间戳:每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引。
2.
3.4.
5.
6.
7.
8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据
8.1 修改列族版本数
创建一个hbase表:
表结构如下
表结构显示版本数为1。
修改表结构,让Hbase表支持存储3个VERSIONS的版本列
查看表结构:
表结构变为3。
8.2 插入多版本数据
插入两行数据并查看:
8.3 查多版本数据
从上面可以看出,插入了两行数据到表中,并且两行数据的rowkey一致,然后使用get命令来获取这一行数据,发现只返回了最新的一行数据。
获取多行数据: