摘要: 表设计的优化 1.预分区 建表时,预先创建一些空的Region,这样当数据写入HBase时,会按照Region分区情况,在集群内数据的负载均衡。 默认情况建表自动创建一个Region分区,导入数据的时候所有的HBase客户端都向这一个Region写数据,直到这个Region足够大了才进行切分。 2. 阅读全文
posted @ 2020-12-30 23:50 yangyh11 阅读(191) 评论(0) 推荐(0) 编辑
摘要: HBase简介 Hbase(Hadoop Database),是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库。 利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中海量数据,利用Zookeeper作为其分布式协同服务。 主要用来存储非结 阅读全文
posted @ 2020-12-30 23:48 yangyh11 阅读(176) 评论(0) 推荐(0) 编辑