2017年3月27日

[How to] Phoenix 与 CDH5.4.2 HBase的整合

摘要: 1.简介 Phoenix将SQL带回到了NOSQL的世界,其在HBase之上做了一个layer,客户端通过SQL调用Phoenix,Phoenix在转化为HBase客户算API进行访问HBase,其很多计算也是通过HBase的协处理器的机制来完成的。当前很多场景下使用CDH版本的HBase,可惜Cl 阅读全文

posted @ 2017-03-27 14:33 xf-xrh-xf 阅读(1832) 评论(0) 推荐(0) 编辑

2017年3月14日

【会装】kylin的安装(填坑)和简单使用

摘要: 1.简介 kylin的设计思想是空间换时间,将hive上的大表的维度全部排列组合计算也将度量提前计算然后存入HBase库,这个步骤在kylin中称之为build cube。 在查询的时候已经建立cube的hive表会直接访问HBase的scan来拿出结果,对于度量则可以直接get即可。由于数据量的膨 阅读全文

posted @ 2017-03-14 14:46 xf-xrh-xf 阅读(3484) 评论(0) 推荐(0) 编辑

[会装]Hive安装(基于mysql数据库)

摘要: 环境信息:Mac 安装步骤: 1. 下载hive组件(我选择的是社区的2.0.1版本) http://apache.mirror.globo.tech/hive/hive-2.0.1/ 2. 下载mysql驱动 https://dev.mysql.com/downloads/connector/j/ 阅读全文

posted @ 2017-03-14 14:25 xf-xrh-xf 阅读(403) 评论(0) 推荐(0) 编辑

2017年3月1日

[How to]HBase集群备份方法--Replication机制

摘要: 1.简介 HBase备份的方法在[How to]HBase集群备份方法文章中已经有些介绍,但是这些方法都不是HBase本身的特性在支持,都是通过MR计算框架结合HBase客户端的方式,或者直接拷贝HBase的底层hdfs数据的方式进行备份的,但从操作上来说也比较繁琐复杂,数据完整性和及时性上也做的并 阅读全文

posted @ 2017-03-01 01:19 xf-xrh-xf 阅读(8208) 评论(2) 推荐(1) 编辑

2017年2月17日

[How to]HBase集群备份方法

摘要: 1.简介 当HBase数据库中存在非常重要的业务数据的时候为了保护数据的可以对数据进行备份处理。对于HBase来说从备份操作来看可分为离线备份和在线备份。 2. 前准备 在测试环境上准备有哦两套HBase集群,资源有限原因他们共享一个hdfs集群和zookeeper,通过配置不同node路径和数据路 阅读全文

posted @ 2017-02-17 17:58 xf-xrh-xf 阅读(5663) 评论(0) 推荐(1) 编辑

2017年2月14日

[How to] HBase的bulkload使用方法

摘要: 1.简介 将数据插入HBase表中的方法很多,我们可以通过TableOutputFormat以Mapreduce on HBase的方式将数据插入,也可以单纯的使用客户端API将数据插入。但是以上方法效率并不高。 而使用BulkLoad特性能够利用MR计算框架将源数据直接生成内部的hfile格式,然 阅读全文

posted @ 2017-02-14 23:39 xf-xrh-xf 阅读(3382) 评论(0) 推荐(1) 编辑

How to recover NameNode HA, when one accidentally formated one of the two NameNodes

摘要: https://community.hortonworks.com/content/supportkb/48981/how-to-recover-namenode-ha-when-one-accidentally-f.html 阅读全文

posted @ 2017-02-14 16:46 xf-xrh-xf 阅读(126) 评论(0) 推荐(0) 编辑

2017年2月13日

[How to] MapReduce on HBase ----- 简单二级索引的实现

摘要: 1.简介 MapReduce计算框架是二代hadoop的YARN一部分,能够提供大数据量的平行批处理。MR只提供了基本的计算方法,之所以能够使用在不用的数据格式上包括HBase表上是因为特定格式上的数据读取和写入都实现了各自的inputformat和outputformat,这样MR就通过这两个接口 阅读全文

posted @ 2017-02-13 21:27 xf-xrh-xf 阅读(2363) 评论(0) 推荐(0) 编辑

2017年2月9日

[How to] 使用HBase协处理器---Endpoint客户端代码的实现

摘要: 1.简介 不同于Observer协处理器,EndPoint由于需要同region进行rpc服务的通信,以及客户端出数据的归并,需要自行实现客户端代码。 基于[How to] 使用HBase协处理器 Endpoint服务端的实现这篇文章,我们继续实现其客户端代码。 2.客户端代码实现方式介绍 目前基于 阅读全文

posted @ 2017-02-09 18:24 xf-xrh-xf 阅读(962) 评论(0) 推荐(0) 编辑

[How to] 使用HBase协处理器---Endpoint服务端的实现

摘要: 1.简介 前篇文章[How to] 使用HBase协处理器 基本概念和regionObserver的简单实现中提到了两种不同的协处理器,并且实现了regionObserver。 本文将介绍如何使用EndPoint协处理器类型。 与Observer类型不同的是,Endpoint协处理器需要与服务区直接 阅读全文

posted @ 2017-02-09 15:27 xf-xrh-xf 阅读(4448) 评论(0) 推荐(0) 编辑

导航