随笔分类 -  Hbase

摘要:HBase是以Region为最小的存储和负载单元(这里可不是HDFS的存储单元),因此Region的负载管理,关系到了数据读写的性能。先抛开Region如何切分不说,看看Region是如何分配到各个RegionServer的吧。 更多内容参考—— "我的大数据学习之路" Region在HBase中的 阅读全文
posted @ 2018-07-12 18:47 xingoo 阅读(3792) 评论(0) 推荐(0) 编辑
摘要:Spark是目前最流行的分布式计算框架,而HBase则是在HDFS之上的列式分布式存储引擎,基于Spark做离线或者实时计算,数据结果保存在HBase中是目前很流行的做法。例如用户画像、单品画像、推荐系统等都可以用HBase作为存储媒介,供客户端使用。 因此Spark如何向HBase中写数据就成为很 阅读全文
posted @ 2018-02-28 23:05 xingoo 阅读(19417) 评论(8) 推荐(0) 编辑
摘要:今天做了一个跨地区机房的压测小程序,主要的思路就是基于事先准备好的rowkey文件,利用多线程模拟并发的rowkey查询,可以实现并发数的自由控制。主要是整个流程下来,遇到了点打包的坑,所以特意记录下。 编写代码 rowkey文件的准备就不说了。首先是HbaseClient的查询接口,由于创建连接的 阅读全文
posted @ 2017-11-24 22:26 xingoo 阅读(2098) 评论(0) 推荐(2) 编辑
摘要:Hbase是基于HDFS的NOsql数据库,它很多地方跟数据库差不多,也有很多不同的地方。这里就不一一列举了,不过Hbase有个版本控制的特性,这个特性在很多场景下都会发挥很大的作用。本篇就介绍下基于 和`Java API`的Hbase多版本的读写。 为了更好的理解多版本,我们可以把普通的数据存储理 阅读全文
posted @ 2017-07-03 21:40 xingoo 阅读(9832) 评论(1) 推荐(0) 编辑
摘要:status 查看系统状态 version 查看版本号 table_help 查看提示信息 表的管理 create 创建表 list 查看表 describe 表的描述 disable 表的禁用 drop 表的删除 exsits 判断是否存在 数据操作 put 增加和修改数据 向指定的列族中插入数据 阅读全文
posted @ 2017-06-09 23:19 xingoo 阅读(2694) 评论(0) 推荐(2) 编辑

点击右上角即可分享
微信分享提示