09 2017 档案
摘要:记一个比较初级的笔记。 流程 1. 创建一张表 2. 插入10条数据 3. 查看HFile 操作 1.创建表 2.插入10条数据 3. 查看HFile 命令:hbase hfile -v -p -m -f hdfs://ns/hbase/data/default/TEST1/5cd31c374a3b
阅读全文
摘要:通过MemoryUsage可以查看Java 虚拟机的内存池的内存使用情况。MemoryUsage类有四个值(均以字节为单位): Init java虚拟机在启动的时候向操作系统请求的初始内存容量。 java虚拟机在运行的过程中可能向操作系统请求更多的内存或将内存释放给操作系统,所以init的值是不确定
阅读全文
摘要:转自:http://blog.sina.com.cn/s/blog_ae33b83901018euz.html HBase有几个高级特性,在你设计表时可以使用。这些特性不一定联系到模式或行键设计,但是它们定义了某些方面的表行为。本节我们讨论这些配置参数,以及你可以如何使用它们。1 可配置的数据块大小
阅读全文
摘要:数据写入流程 源码:https://github.com/apache/hbase/blob/master/hbase-server/src/main/java/org/apache/hadoop/hbase/regionserver/HRegion.java 函数:doMiniBatchMutat
阅读全文
摘要:一直有一个问题,今天调查了一下源码算是明白了。 问题 通过java api(如下代码所示)在创建表的时候,可以通过setMemStoreFlushSize函数来指定memstore的大小, 在集群配置文件中,也可以通过配置hbase.hregion.memstore.flush.size来指定mem
阅读全文
摘要:(what)什么是预分区? HBase表在刚刚被创建时,只有1个分区(region),当一个region过大(达到hbase.hregion.max.filesize属性中定义的阈值,默认10GB)时, 表将会进行split,分裂为2个分区。表在进行split的时候,会耗费大量的资源,频繁的分区对H
阅读全文
摘要:HBase版本:1.3.1 TTL(Time-To-Live):每个Cell的数据超时时间(当前时间 - 最后更新的时间) MinVersion:如果当前存储的所有时间版本都早于TTL,至少MIN_VERSION个最新版本会保留下来。这样确保在你的查询以及数据早于TTL时有结果返回。 先做一个实验
阅读全文
摘要:memstoreFlushSize是什么呢? memstoreFlushSize为HRegion上设定的一个阈值,当MemStore的大小超过这个阈值时,将会发起flush请求。 它的计算首先是由Table决定的,即每个表可以设定自己的memstoreFlushSize,通过关键字MEMSTORE_
阅读全文
摘要:hbase版本:1.3.1 目的:HBase新API的使用方法。 尝试并验证了如下几种java api的使用方法。 1.创建表 2.创建表(预分区) 3.单条插入 4.批量插入 5.批量插入(客户端缓存) 6.单条get 7.批量get 8.简单scan 9.混合使用 ■实际代码 https://g
阅读全文
摘要:正在使用vim命令编辑文件,然后虚拟机突然重启,再次使用vim编辑这个文件时,就会提示下图: .swp文件的产生 使用vi或vim命令打开一个文件,就会产生一个.(filename).swp的文件。 如果编辑完成之后,正常退出,那么这个swp文件就会被自动删除。 另外,.swp文件属于隐藏文件,可以
阅读全文
摘要:在.vimrc(或/etc/vimrc)文件中输入如下文本: set tabstop=4 set softtabstop=4 set shiftwidth=4 set noexpandtab set nu set autoindent set cindent 其中:Tabstop:表示一个 tab
阅读全文