create 'NewsClickFeedback',{NAME=>'Toutiao',VERSIONS=>3,BLOCKCACHE=>true,BLOOMFILTER=>'ROW',COMPRESSION=>'SNAPPY',TTL => ' 259200 '},{SPLITS => ['1','2','3','4','5','6','7','8','9','a','b','c','d','e','f']}
VERSION
scan 'NewsClickFeedback',{VERSIONS => 2}
BLOOMFILTER
value: NONE|ROW|ROWCOL
作用:对于get操作以及部分scan操作可以剔除掉不会用到的存储文件,减少实际IO次数,提高随机读性能
ROW 类型适用于: get 'NewsClickFeedback', 'rowkey1'
ROWCOL 类型适用于: get 'NewsClickFeedback','rowkey1',{COLUMN => 'Toutiao'}
COMPRESSION
value: Gzip|LZO|Snappy
snappy压缩率最低,编解码速率最高,对CPU的消耗最小,建议使用
TTL
数据过期时间,默认是永久保存
IN_MEMORY
数据是否常驻内存,默认为false
设为true, 业务数据会与HBase Meta元数据存储在同一块缓存区域,如果业务数据过大会把Meta数据被置换出去,导致集群性能下降
BLOCKCACHE
是否开启block cache缓存,默认开启
SPLITS
region预分配策略
一定程度上解决热点应用数据剧增导致系统自动split引起的性能问题