Hyperbase常用SQL

1、创建表
1.1 建HBase内表 
CREATE TABLE hbase_inner_table(
  key1 string,
  bi bigint,
  dc decimal(10,2),
  ch varchar(10),
  ts timestamp,
  en string
)STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler';
-- 创建了一张名为 hbase_inner_table 的内表,存储格式为 HBaseStorageHandler 。

1.2 建HBase外表 
CREATE EXTERNAL TABLE hbase_external_table(
  key1 string,
  ex1 double,
  ex3 date,
  ex5 string
)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping"=":key,f:q1,f:q4,f:q5") ① 
TBLPROPERTIES ("hbase.table.name"="test.hbase_inner_table");② 
-- ① 指定外表 hbase_external_table 和已存在的 hbase_inner_table 表的列映射关系。
-- ② 指定外表 hbase_external_table 中的列与源表的映射关系。映射时数据类型强行转换,转换失败则 为NULL。

2、为内表 hbase_inner_table 添加列
ALTER TABLE hbase_inner_table ADD COLUMNS (bl boolean);
-- 对表hbase_inner_table添加了一个数据类型为 boolean 列bl。

3、清空内表 hbase_inner_table
TRUNCATE TABLE hbase_inner_table;
-- 表中数据被清空,但表的元数据信息仍存在,可通过 DESCRIBE FORMATTED 查看。

4、删除表
DROP TABLE <tableName>;

5、创建索引
5.1 为内表 hbase_inner_table 创建全局索引
CREATE GLOBAL INDEX ch_global ON hbase_inner_table(ch(10));
-- 根据列ch创建一个名为ch_global的全局索引,并指定该索引字段的长度为10.

5.2 为内表 hbase_inner_table 创建全文索引
CREATE FULLTEXT INDEX ON hbase_inner_table(bi,ch,en) SHARD NUM 1;
-- 为内表hbase_inner_table根据列en、cn来创建全文索引

6、删除索引
6.1 删除全局索引:ch_global
DROP INDEX ch_global ON hbase_inner_table;

6.2 删除内表 hbase_inner_table 的全文索引
DROP FULLTEXT INDEX ON hbase_inner_table;
-- 目前HBase不支持使用SQL生成索引,您可以从hbase shell中执行 rebuild 指令来生成索引

7、插入数据
7.1 向hbase_inner_table表中单条插入数据
INSERT INTO hbase_inner_table
VALUES('001',1,1.01,'Hyperbase','2017-01-08 20:31:46','sunday',true);
INSERT INTO hbase_inner_table
VALUES('002',2,2.01,'transwarp hbase','2017-01-09 10:25:45','monday',true);
INSERT INTO hbase_inner_table
VALUES('003',3,3.01,'hbase','2017-01-10 15:05:20','tuesday',false);

7.2 向hbase_inner_table表中批量插入数据
BATCHINSERT INTO hbase_inner_table BATCHVALUES (
VALUES('004',4,4.01,'esdrive','2017-01-11 15:05:20','wednesday',false),
VALUES('005',5,5.01,'transwarp es','2017-01-12 15:18:18','thursday',false),
VALUES('006',6,6.01,'hyperdrive','2017-01-13 05:13:13','friday',false),
VALUES('007',7,7.01,'inceptor','2017-01-14 10:55:20','saturday',false),
VALUES('008',8,8.01,'fulltext','2017-01-15 17:23:40','tuestuesday',false)
);

8、更新数据
update hbase_inner_table set bl=false where key1='001';

9、删除记录
DELETE FROM hbase_inner_table WHERE key1='001';

10、利用索引查询
set ngmr.exec.mode=local;
-- 该参数设置完成后才能利用索引进行有效的查询

10.1 全局索引
10.1.1 用全局索引ch_global查询
select/*+USE_INDEX(t1 USING ch_global)*/ * from hbase_inner_table t1 where ch='hbase'and bl=false;
-- 利用全局索引‘ch_global’查询列ch中值为‘hbase’,且列bl值为false的记录。

10.1.2 不使用全局索引进行查询
select/*+USE_INDEX(t1 USING NOT_USE_INDEX)*/ key1, bi, dc, ch, ts, en, bl from hbase_inner_table t1 where ch='hbase'and bl=false;
-- 不利用索引查询列ch值为‘hbase’,且列bl值为false的记录。

10.2 全文索引
10.2.1 精确匹配(term)
select * from hbase_inner_table where contains(en, "term 'tuesday'");

10.2.2 前缀匹配(prefix)
select * from hbase_inner_table where contains(en, "prefix 'tues'");

10.2.3 模糊查询(wildcard)
select * from hbase_inner_table where contains(en, "wildcard 'tues*day'");
-- 查询 \* 前的字符 tues出现任意次,且以 day结尾记录。

10.2.4 多个操作符查询
select * from hbase_inner_table where contains(en, "wildcard 'tues*day'") and contains(bi,"term '3'");
 
10.2.5 in表达式(in)//枚举
select * from hbase_inner_table where contains(en, "in 'sunday,monday'");

10.2.6 正则表达式(regexp)
select * from hbase_inner_table where contains(en, "regexp 's.*y'");
-- 查询en列满足正则表达式为 's.*y' 的记录,.* 表示 s和 y间可出现任意个字符。

10.2.7 全文检索(match)
select * from hbase_inner_table where contains(en, "match 'tuesday'");
-- 不要对非 STRING 类型进行模糊、前缀、正则等查询。如果是对数字类型的进行范围查询,则需保证该列的数据类型为 #b 才可以

10.2.8 范围查询
select * from hbase_inner_table where contains(bi, "> '6'");

10.2.9 范围表达式(range)
select * from hbase_inner_table where contains(bi, "range '[1,3)'");
posted @ 2019-12-27 16:37  勤奋的园  阅读(1237)  评论(1编辑  收藏  举报