随笔分类 - 大数据
记录大数据学习过程中的点滴,涉及hbase,hadoop相关
摘要:为充分利用HBase集群的计算性能,计划在HBase上混布MR集群,不过在部署过程中出现很多问题,问题主要集中在配置Cgroup资源隔离方面,在此记录下部署过程及所出现的问题以便回溯。
阅读全文
摘要:业务使用HBase已经有一段时间了,期间也反馈了很多问题,其中反馈最多的是HBase是否支持SQL查询和二级索引,由于HBase在这两块上目前暂不支持,导致业务在使用时无法更好的利用现有的经验来查询HBase。虽然HBase本身不支持SQL,但业界还是有现成的方案来支持,如Hive、Impala、Phoenix等。众多方案各有各的优势,本文主要对Phoenix作一个大概的介绍。
阅读全文
摘要:HBase数据同步,是指从一个集群同步到另一个集群,一般当机房迁移、扩容新集群和集群升级时需要做数据迁移同步。本文介绍下目前常用的几种数据同步方案
阅读全文
摘要:在生产环境使用HBase过程中,随着数据量的不断增加,查询HBase数据变得越来越慢,对于业务来说是不可用的,需要对读性能进行优化
阅读全文
摘要:本文主要介绍一下hbase数据落地方面的一些经验,涉及表rowkey设计和数据入hbase方案
阅读全文
摘要:hbase入门,记录了下HBASE安装的一些过程
阅读全文
摘要:jython 操作hbase, 创建相关表及设置参数
阅读全文