摘要: 1、Region数量的影响 通常较少的region数量可使群集运行的更加平稳,官方指出每个RegionServer大约100个regions的时候效果最好,理由如下: 1)Hbase的一个特性MSLAB,它有助于防止堆内存的碎片化,减轻垃圾回收Full GC的问题,默认是开启的。但是每个MemSto 阅读全文
posted @ 2019-08-18 21:31 sw_kong 阅读(1949) 评论(0) 推荐(0) 编辑
摘要: 我们知道,hbase表可以设置一个至多个列簇(column families),但是为什么说越少的列簇越好呢? 官网原文: HBase currently does not do well with anything above two or three column families so kee 阅读全文
posted @ 2019-08-18 21:15 sw_kong 阅读(1601) 评论(0) 推荐(0) 编辑
摘要: 创建一张表test_explode,表结构如下 表数据如下: 1.使用explode函数 但是只使用explode函数很难满足实际需求,原因如下: 1.1 No other expressions are allowed in SELECT 1.2 UDTF's can't be nested 1. 阅读全文
posted @ 2019-08-18 09:45 sw_kong 阅读(712) 评论(0) 推荐(0) 编辑