HBase(基于HDFS)的使用

补充:使用secure CRT操作hbase

(一)修改secureCRT配置环境

(二)使用hbase,查看所有命令

一:create建表(创建user表,包括base_info、extra_info两个列族)

create 'user',{NAME=>'base_info',VERSIONS=>3},{NAME=>'extra_info'}

可以使用list命令查看所有数据表: 

可以使用describe命令,查看数据表结构:

二:数据表的删除drop 

 注意在删除表之前,需要先使得表状态为disable

三:向表中插入数据

向user表中插入信息,row key为rk0001,列族base_info中添加name列标示符,值为zhangsan

put 'user', 'rk0001', 'base_info:name', 'zhangsan'

向user表中插入信息,row key为rk0001,列族base_info中添加gender列标示符,值为female

put 'user', 'rk0001', 'base_info:gender', 'female'

向user表中插入信息,row key为rk0001,列族base_info中添加age列标示符,值为20

put 'user', 'rk0001', 'base_info:age', 20

向user表中插入信息,row key为rk0001,列族extra_info中添加pic列标示符,值为picture

put 'user', 'rk0001', 'extra_info:pic', 'picture'

四:get获取表数据

(一)获取user表中row key为rk0001的所有信息

get 'user', 'rk0001'

(二)获取user表中row key为rk0001,base_info列族的所有信息

get 'user', 'rk0001', 'base_info'

(三)获取user表中row key为rk0001,base_info列族的name、age列标示符的信息

get 'user', 'rk0001', 'base_info:name', 'base_info:age'

(四)获取user表中row key为rk0001,base_info、extra_info列族的信息

get 'user', 'rk0001', 'base_info', 'extra_info'
get 'user', 'rk0001', {COLUMN => ['base_info', 'extra_info']}

get 'user', 'rk0001', {COLUMN => ['base_info:name', 'extra_info:pic']}

(五)获取user表中row key为rk0001,列族为base_info,版本号最新5个的信息

get 'user', 'rk0001', {COLUMN => 'base_info', VERSIONS => 2}
get 'user', 'rk0001', {COLUMN => 'base_info:name', VERSIONS => 5}
get 'user', 'rk0001', {COLUMN => 'base_info:name', VERSIONS => 5, TIMERANGE => [xxx时间戳, xxx时间戳]}

五:条件查询 

(一)ValueFilter值过滤---获取user表中row key为rk0001,cell的值包含zh的信息

get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'substring:zh')"}

(二)QualifierFilter键过滤---获取user表中row key为rk0001,列标示符中含有a的信息

get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}

(三)ValueFIlter值过滤,使用=进行值查询时:注意数据存储是按照二进制存储,所有使用binary 

put 'user', 'rk0002', 'base_info:name', 'fanbingbing'
put 'user', 'rk0002', 'base_info:gender', 'female'
put 'user', 'rk0002', 'base_info:nationality', '中国'
get 'user', 'rk0002', {FILTER => "ValueFilter(=, 'binary:中国')"}

六:Scan查询操作 

会一块查询HLog中的数据

(一)查询user表中的所有信息

scan 'user'

(二)查询user表中列族为base_info的信息

scan 'user', {COLUMNS => 'base_info'}
scan 'user', {COLUMNS => 'base_info', RAW => true, VERSIONS => 5}

(三)查询user表中列族为base_info和extra_info的信息

scan 'user', {COLUMNS => ['base_info', 'extra_info']}
scan 'user', {COLUMNS => ['base_info:name', 'extra_info:pic']}

(四)查询user表中列族为base_info、列标示符为name的信息

scan 'user', {COLUMNS => 'base_info:name'}

(五)查询user表中列族为base_info、列标示符为name的信息,并且版本最新的5个

scan 'user', {COLUMNS => 'base_info:name', VERSIONS => 5}

 注意:scan查询版本时,有时可以比get多查询出一个。因为我们新写入的数据存放在HLog中,没有写入HFile中,所以scan将数据全部获取,get只获取3个最新版本

(六)查询user表中列族为base_info和extra_info且列标示符中含有a字符的信息

scan 'user', {COLUMNS => ['base_info', 'extra_info'], FILTER => "(QualifierFilter(=,'substring:a'))"}

(七)查询user表中列族为base_info,rk范围是[rk0001, rk0003)的数据

scan 'user', {COLUMNS => 'base_info', STARTROW => 'rk0001', ENDROW => 'rk0003'}

(八)查询user表中row key以rk字符开头的

scan 'user',{FILTER=>"PrefixFilter('rk')"}

(九)查询user表中指定范围的数据

scan 'user', {TIMERANGE => [xxx时间戳, xxx时间戳]}

七:数据修改 

(一)delete删除数据

删除user表row key为rk0001,列标示符为base_info:name,timestamp为1583222243421的数据

delete 'user', 'rk0001', 'base_info:name', 1583222243421

删除user表row key为rk0001,列标示符为base_info:name的数据

delete 'user', 'rk0001', 'base_info:name'

(二)清空user表中的数据

truncate 'user'

(三)修改表结构---添加列族

首先停用user表(新版本不用)

disable 'user'

添加两个列族f1和f2

alter 'user', NAME => 'f1'
alter 'user', NAME => 'f2'

启用表

enable 'user'

(四)修改表结构---删除列族

###disable 'user'(新版本不用)

删除一个列族:

alter 'user', NAME => 'f1', METHOD => 'delete' 或 alter 'user', 'delete' => 'f1'

添加列族f1同时删除列族f2

alter 'user', {NAME => 'f1'}, {NAME => 'f2', METHOD => 'delete'}

将user表的f1列族版本号改为5

alter 'user', NAME => 'info', VERSIONS => 5

启用表

enable 'user'

 

posted @ 2020-03-03 16:57  山上有风景  阅读(627)  评论(0编辑  收藏  举报