随笔分类 - HBase
摘要:java代码如下:package db.query;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;imp...
阅读全文
摘要:原文链接:hbase源码系列(四)数据模型-表定义和列族定义的具体含义hbase是一个KeyValue型的数据库,在《hbase实战》描述它的逻辑模型【行键,列族,列限定符,时间版本】,物理模型是基于列族的。但实际情况是啥?还是上点代码吧。 HTableDescriptor tableDes...
阅读全文
摘要:1. 在本方案中,我们要将数据存储到HBase中,所以使用flume中提供的hbase sink,同时,为了清洗转换日志数据,我们实现自己的AsyncHbaseEventSerializer。package com.ncc.dlut;import java.io.UnsupportedEncodin...
阅读全文
摘要:原文链接:http://www.blogjava.net/ivanwan/archive/2011/06/15/352350.html因官方Book Performance Tuning部分章节没有按配置项进行索引,不能达到快速查阅的效果。所以我以配置项驱动,重新整理了原文,并补充一些自己的理解,如...
阅读全文
摘要:原文链接:开启hadoop和Hbase集群的lzo压缩功能 问题导读:1.如何启动hadoop、hbase集群的压缩功能?2.lzo的作用是什么?3.hadoop配置文件需要做哪些修改?首先我们明白一个概念:LZO 是致力于解压速度的一种数据压缩算法,LZO 是 Lempel-Ziv-Oberhum...
阅读全文
摘要:原文链接:HBase性能优化方法总结(一):表的设计本文主要是从HBase应用程序设计与开发的角度,总结几种常用的性能优化方法。有关HBase系统配置级别的优化,可参考:淘宝Ken Wu同学的博客。下面是本文总结的第一部分内容:表的设计相关的优化方法。1. 表的设计1.1 Pre-Creating ...
阅读全文
摘要:java代码如下:package db.query;import org.apache.commons.logging.Log;import org.apache.commons.logging.LogFactory;import org.apache.hadoop.conf.Configurati...
阅读全文
摘要:java代码如下:package db.insert;import java.util.Iterator;import java.util.StringTokenizer;import org.apache.spark.SparkConf;import org.apache.spark.api.ja...
阅读全文
摘要:java代码如下:package db.insert;/* * 创建一个students表,并进行相关操作 */import java.io.IOException;import java.io.Serializable;import java.util.ArrayList;import java....
阅读全文
摘要:原文链接:HBase入门基础教程在本篇文章中,我们将介绍Hbase的单机模式安装与伪分布式的安装方式,以及通过浏览器查看Hbase的用户界面。搭建HBase伪分布式环境的前提是我们已经搭建好了Hadoop完全分布式环境,搭建Hadoop环境请参考:【Hadoop入门基础教程】4、Hadoop之完全分...
阅读全文
摘要:所用HBase版本为1.1.2,hadoop版本为2.4/* * 创建一个students表,并进行相关操作 */import java.io.IOException;import java.util.ArrayList;import java.util.List; import org.apach...
阅读全文
摘要:原文链接:HBase介绍及简易安装HBase简介HBase是Apache Hadoop的数据库,能够对大型数据提供随机、实时的读写访问,是Google的BigTable的开源实现。HBase的目标是存储并处理大型的数据,更具体地说仅用普通的硬件配置,能够处理成千上万的行和列所组成的大型数据库。HBa...
阅读全文