HBase 入门 —— 实验二 hbase 基础命令的使用
HBase 入门 —— 实验二
实验内容
使用Hadoop提供的HBase shell命令完成以下任务:
-
列出当前 HBase所有表的相关信息、如表名、创建时间等;
-
创建教材表4-4(存放网页摘要信息)的表,并插入数据;
-
统计所创建表的行数
实验步骤
首先打开所有需要的环境:
ssh localhost
start-dfs.sh
start-hbase.sh
# 进入 hbase shell 命令行
hbase shell
注意:这里我们后面有的命令都是在 hbase shell 的命令行下进行运行的
我们可以使用 hbase 中自带的 list 语法查看当前表中的所有内容:
list

然后我们需要在命令行下创建这个表格:

这里我们直接使用 create 命令创建表格:
create '实例' , '行键' , '时间戳' , '列族contents' , '列族anchor'
# 这里的第一个变量是我们要创建的表名,其余的是列
我们在执行上述命令后,再次查询,就能看到我们已经创建了一个表格:

下面我们开始插入数据;
put '实例','row1','行键','com.cnn.www'
put '实例','row1','时间戳','t5'
put '实例','row1','时间戳','t4'
put '实例','row1','列族anchor','anchor.cnnsi.com=CNN'
put '实例','row1','列族anchor','anchor.my.look.ca=CNN.com'
然后我们使用查询命令就能查询到我们刚刚创建的数据:

这里如果我们想要删除表,就需要先将表格弃用,然后再删除:
# 先弃用
disable '表名'
# 再删除
drop '表名'
如果我们想要查询表中的所有历史记录:
scan '表名' , {RAW=>TRUE,VERSIONS=>3,TIMERANGE=>[1,2]}
# 这里 {} 中的两个变量如下:
# RAW=>TRUE 表示显示列名
# VERSIONS=>3 表示最多显示统一行,同一列下我们的最新的三次列值变化,也就是最近三次时间戳我们对当前值的改变
# TIMERANGE 表示查看时间戳1到2的值