1、创建表
1.1 建HBase内表
CREATE TABLE hbase_inner_table(
key1 string,
bi bigint,
dc decimal(10,2),
ch varchar(10),
ts timestamp,
en string
)STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler';
-- 创建了一张名为 hbase_inner_table 的内表,存储格式为 HBaseStorageHandler 。
1.2 建HBase外表
CREATE EXTERNAL TABLE hbase_external_table(
key1 string,
ex1 double,
ex3 date,
ex5 string
)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping"=":key,f:q1,f:q4,f:q5") ①
TBLPROPERTIES ("hbase.table.name"="test.hbase_inner_table");②
-- ① 指定外表 hbase_external_table 和已存在的 hbase_inner_table 表的列映射关系。
-- ② 指定外表 hbase_external_table 中的列与源表的映射关系。映射时数据类型强行转换,转换失败则 为NULL。
2、为内表 hbase_inner_table 添加列
ALTER TABLE hbase_inner_table ADD COLUMNS (bl boolean);
-- 对表hbase_inner_table添加了一个数据类型为 boolean 列bl。
3、清空内表 hbase_inner_table
TRUNCATE TABLE hbase_inner_table;
-- 表中数据被清空,但表的元数据信息仍存在,可通过 DESCRIBE FORMATTED 查看。
4、删除表
DROP TABLE <tableName>;
5、创建索引
5.1 为内表 hbase_inner_table 创建全局索引
CREATE GLOBAL INDEX ch_global ON hbase_inner_table(ch(10));
-- 根据列ch创建一个名为ch_global的全局索引,并指定该索引字段的长度为10.
5.2 为内表 hbase_inner_table 创建全文索引
CREATE FULLTEXT INDEX ON hbase_inner_table(bi,ch,en) SHARD NUM 1;
-- 为内表hbase_inner_table根据列en、cn来创建全文索引
6、删除索引
6.1 删除全局索引:ch_global
DROP INDEX ch_global ON hbase_inner_table;
6.2 删除内表 hbase_inner_table 的全文索引
DROP FULLTEXT INDEX ON hbase_inner_table;
-- 目前HBase不支持使用SQL生成索引,您可以从hbase shell中执行 rebuild 指令来生成索引
7、插入数据
7.1 向hbase_inner_table表中单条插入数据
INSERT INTO hbase_inner_table
VALUES('001',1,1.01,'Hyperbase','2017-01-08 20:31:46','sunday',true);
INSERT INTO hbase_inner_table
VALUES('002',2,2.01,'transwarp hbase','2017-01-09 10:25:45','monday',true);
INSERT INTO hbase_inner_table
VALUES('003',3,3.01,'hbase','2017-01-10 15:05:20','tuesday',false);
7.2 向hbase_inner_table表中批量插入数据
BATCHINSERT INTO hbase_inner_table BATCHVALUES (
VALUES('004',4,4.01,'esdrive','2017-01-11 15:05:20','wednesday',false),
VALUES('005',5,5.01,'transwarp es','2017-01-12 15:18:18','thursday',false),
VALUES('006',6,6.01,'hyperdrive','2017-01-13 05:13:13','friday',false),
VALUES('007',7,7.01,'inceptor','2017-01-14 10:55:20','saturday',false),
VALUES('008',8,8.01,'fulltext','2017-01-15 17:23:40','tuestuesday',false)
);
8、更新数据
update hbase_inner_table set bl=false where key1='001';
9、删除记录
DELETE FROM hbase_inner_table WHERE key1='001';
10、利用索引查询
set ngmr.exec.mode=local;
-- 该参数设置完成后才能利用索引进行有效的查询
10.1 全局索引
10.1.1 用全局索引ch_global查询
select/*+USE_INDEX(t1 USING ch_global)*/ * from hbase_inner_table t1 where ch='hbase'and bl=false;
-- 利用全局索引‘ch_global’查询列ch中值为‘hbase’,且列bl值为false的记录。
10.1.2 不使用全局索引进行查询
select/*+USE_INDEX(t1 USING NOT_USE_INDEX)*/ key1, bi, dc, ch, ts, en, bl from hbase_inner_table t1 where ch='hbase'and bl=false;
-- 不利用索引查询列ch值为‘hbase’,且列bl值为false的记录。
10.2 全文索引
10.2.1 精确匹配(term)
select * from hbase_inner_table where contains(en, "term 'tuesday'");
10.2.2 前缀匹配(prefix)
select * from hbase_inner_table where contains(en, "prefix 'tues'");
10.2.3 模糊查询(wildcard)
select * from hbase_inner_table where contains(en, "wildcard 'tues*day'");
-- 查询 \* 前的字符 tues出现任意次,且以 day结尾记录。
10.2.4 多个操作符查询
select * from hbase_inner_table where contains(en, "wildcard 'tues*day'") and contains(bi,"term '3'");
10.2.5 in表达式(in)//枚举
select * from hbase_inner_table where contains(en, "in 'sunday,monday'");
10.2.6 正则表达式(regexp)
select * from hbase_inner_table where contains(en, "regexp 's.*y'");
-- 查询en列满足正则表达式为 's.*y' 的记录,.* 表示 s和 y间可出现任意个字符。
10.2.7 全文检索(match)
select * from hbase_inner_table where contains(en, "match 'tuesday'");
-- 不要对非 STRING 类型进行模糊、前缀、正则等查询。如果是对数字类型的进行范围查询,则需保证该列的数据类型为 #b 才可以
10.2.8 范围查询
select * from hbase_inner_table where contains(bi, "> '6'");
10.2.9 范围表达式(range)
select * from hbase_inner_table where contains(bi, "range '[1,3)'");