[Hadoop源码详解]之一MapReduce篇之InputFormat
摘要:从Java底层源码去看数据读入Map阶段的原理,追根溯源的学习输入文件是如何被过滤、读取、分片、读出“K-V对”,然后交给Mapper类来处理的。
阅读全文
posted @
2013-02-28 08:52
石头儿
阅读(9574)
推荐(7) 编辑
MapReduce生成HFile入库到HBase
摘要:详细介绍HBase提供的一个比较高效快捷的入库方法:Bulk Loading,即HBase提供的HFileOutputFormat类。
1.这种方式的优点
2.这种方式的局限
3.生成HFile部分介绍
4.入库介绍
阅读全文
posted @
2013-02-20 11:01
石头儿
阅读(10578)
推荐(2) 编辑
深入理解HBase Memstore
摘要:全面深入的讲解HBase Memstore的相关知识,阅读完本文之后,相信你对HBase Memstore的理解,注意事项,相关配置项,都会有一个全面深入的认识,对于集群的维护及调优都会有指导意义,本文主要介绍:
1.HBase Memstore概览
2.HBase Memstore关注要点
3.配置Memstore Flushes
4.频繁的Memstore Flushes 问题
5.多CF与Memstore Flushes 问题
6.HLog(WAL) size 与Memstore Flushes 问题
7.压缩与Memstore Flushes 问题
阅读全文
posted @
2013-02-05 10:01
石头儿
阅读(20140)
推荐(6) 编辑