HBase 入门 —— 实验二 hbase 基础命令的使用

HBase 入门 —— 实验二

实验内容

使用Hadoop提供的HBase shell命令完成以下任务:

  • 列出当前 HBase所有表的相关信息、如表名、创建时间等;

  • 创建教材表4-4(存放网页摘要信息)的表,并插入数据;

  • 统计所创建表的行数

实验步骤

首先打开所有需要的环境:

ssh localhost
start-dfs.sh
start-hbase.sh
# 进入 hbase shell 命令行
hbase shell

注意:这里我们后面有的命令都是在 hbase shell 的命令行下进行运行的

我们可以使用 hbase 中自带的 list 语法查看当前表中的所有内容:

list

然后我们需要在命令行下创建这个表格:

这里我们直接使用 create 命令创建表格:

create '实例' , '行键' , '时间戳' , '列族contents' , '列族anchor'
# 这里的第一个变量是我们要创建的表名,其余的是列

我们在执行上述命令后,再次查询,就能看到我们已经创建了一个表格:

下面我们开始插入数据;

put '实例','row1','行键','com.cnn.www'
put '实例','row1','时间戳','t5'
put '实例','row1','时间戳','t4'
put '实例','row1','列族anchor','anchor.cnnsi.com=CNN'
put '实例','row1','列族anchor','anchor.my.look.ca=CNN.com'

然后我们使用查询命令就能查询到我们刚刚创建的数据:

这里如果我们想要删除表,就需要先将表格弃用,然后再删除:

# 先弃用
disable '表名'
# 再删除
drop '表名'

如果我们想要查询表中的所有历史记录:

scan '表名' , {RAW=>TRUE,VERSIONS=>3,TIMERANGE=>[1,2]}
# 这里 {} 中的两个变量如下:
# RAW=>TRUE 表示显示列名
# VERSIONS=>3 表示最多显示统一行,同一列下我们的最新的三次列值变化,也就是最近三次时间戳我们对当前值的改变
# TIMERANGE 表示查看时间戳1到2的值
posted @ 2023-03-21 08:38  ppqppl  阅读(26)  评论(0编辑  收藏  举报