Hbase - 随笔分类 - 1130136248

hbase自带mapreduce计数表行数功能

摘要：$HBASE_HOME/bin/hbase org.apache.hadoop.hbase.mapreduce.RowCounter ‘tablename’ mapreduce来计数，很快的！！！阅读全文

posted @ 2016-02-22 16:41 1130136248 阅读(1861) 评论(0) 推荐(0) 编辑

hadoop 及hbase zookeeper 经常出现问题

摘要：往往是以下几个1/ 各节点时间不统一（写shell文件统一时间）2/配置文件 /etc/hosts文件中ip地址配置错误（更新ip）3/断网后重启机器 ip地址被修改（更新配置文件中的ip）阅读全文

posted @ 2016-01-26 17:55 1130136248 阅读(256) 评论(0) 推荐(0) 编辑

HBase数据的导入和导出

摘要：查阅了几篇中英文资料，发现有的地方说的不是很全部，总结在此，共有两种命令行的方式来实现数据的导入导出功能，即备份和还原。1 HBase本身提供的接口其调用形式为：1）导入./hbase org.apache.hadoop.hbase.mapreduce.Driver import 表名数据文件位... 阅读全文

posted @ 2016-01-19 11:07 1130136248 阅读(1893) 评论(0) 推荐(0) 编辑

浅谈hbase表中数据导出导入（也就是备份）

摘要：转自：http://blog.chinaunix.net/xmlrpc.php?r=blog/article&uid=23916356&id=3321832最近因为生产环境hbase中某张表的数据要导出到测试环境（数据不多，大概200W条左右），如果用程序掉接口导入的话太慢，所以考虑直接用hbas... 阅读全文

posted @ 2016-01-19 11:06 1130136248 阅读(10223) 评论(0) 推荐(0) 编辑

Hadoop生态上几个技术的关系与区别：hive、pig、hbase 关系与区别

摘要：初接触Hadoop技术的朋友肯定会对它体系下寄生的个个开源项目糊涂了，我敢保证Hive,Pig,HBase这些开源技术会把你搞的有些糊涂，不要紧糊涂的不止你一个，如某个菜鸟的帖子的疑问，when to use Hbase and when to use Hive？....请教了^_^没关系这里我... 阅读全文

posted @ 2016-01-14 14:30 1130136248 阅读(692) 评论(0) 推荐(0) 编辑

HBase性能优化方法总结（一）：表的设计

摘要：本文主要是从HBase应用程序设计与开发的角度，总结几种常用的性能优化方法。有关HBase系统配置级别的优化，可参考：淘宝Ken Wu同学的博客。下面是本文总结的第一部分内容：表的设计相关的优化方法。1. 表的设计1.1 Pre-Creating Regions默认情况下，在创建HBase表的时候会... 阅读全文

posted @ 2015-11-26 21:16 1130136248 阅读(284) 评论(0) 推荐(0) 编辑

Java 向Hbase表插入数据报（org.apache.hadoop.hbase.client.HTablePool$PooledHTable cannot be cast to org.apac

摘要：org.apache.hadoop.hbase.client.HTablePool$PooledHTable cannot be cast to org.apac代码：//1.create HTablePoolHTablePool hp=new HTablePool(con, 1000);//2.... 阅读全文

posted @ 2015-11-26 21:11 1130136248 阅读(331) 评论(0) 推荐(0) 编辑

Lucene入门教程（转载）

摘要：lucene 阅读全文

posted @ 2015-11-25 16:29 1130136248 阅读(202) 评论(0) 推荐(0) 编辑

hbase建索引的两种方式

摘要：转载自http://blog.csdn.net/ryantotti/article/details/13295325在二级索引的实现技术上一般有几个方案：1. 表索引使用单独的hbase表存储索引数据，业务表的索引列值做为索引表的rowkey，业务表的rowkey做为索引表的qualifier或va... 阅读全文

posted @ 2015-11-24 11:33 1130136248 阅读(1339) 评论(0) 推荐(0) 编辑

Hbase shell 中能否通过filter实现的高级查询

摘要：import org.apache.hadoop.hbase.filter.CompareFilterimport org.apache.hadoop.hbase.filter.SingleColumnValueFilterimport org.apache.hadoop.hbase.filter.... 阅读全文

posted @ 2015-11-24 11:28 1130136248 阅读(523) 评论(0) 推荐(0) 编辑

为什么Hbase能实现快速的查询

摘要：你的快速是指什么？是根据亿级的记录中快速查询，还是说以实时的方式查询数据。A：如果快速查询（从磁盘读数据），hbase是根据rowkey查询的，只要能快速的定位rowkey,就能实现快速的查询，主要是以下因素：1、hbase是可划分成多个region，你可以简单的理解为关系型数据库的多个分区。2、键... 阅读全文

posted @ 2015-11-24 11:05 1130136248 阅读(9126) 评论(0) 推荐(1) 编辑

Hadoop学习笔记—15.HBase框架学习（基础实践篇）

摘要：Hadoop学习笔记—15.HBase框架学习（基础实践篇）一、HBase的安装配置1.1 伪分布模式安装伪分布模式安装即在一台计算机上部署HBase的各个角色，HMaster、HRegionServer以及ZooKeeper都在一台计算机上来模拟。首先，准备好HBase的安装包，我这里使用... 阅读全文

posted @ 2015-11-18 17:03 1130136248 阅读(246) 评论(0) 推荐(0) 编辑

Hadoop学习笔记—15.HBase框架学习（基础知识篇）

摘要：Hadoop学习笔记—15.HBase框架学习（基础知识篇）HBase是Apache Hadoop的数据库，能够对大型数据提供随机、实时的读写访问。HBase的目标是存储并处理大型的数据。HBase是一个开源的，分布式的，多版本的，面向列的存储模型，它存储的是松散型数据。一、HBase：BigTab... 阅读全文

posted @ 2015-11-18 17:02 1130136248 阅读(219) 评论(0) 推荐(0) 编辑

【转】HBase技术介绍转载自 http://www.searchtb.com/2011/01/understanding-hbase.html

摘要：HBase简介HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现，类似Google Bigtable利用GFS作为其文件... 阅读全文

posted @ 2015-10-19 11:18 1130136248 阅读(242) 评论(0) 推荐(0) 编辑

随笔分类 - Hbase

hbase自带mapreduce计数表行数功能

hadoop 及hbase zookeeper 经常出现问题

HBase数据的导入和导出

浅谈hbase表中数据导出导入（也就是备份）

Hadoop生态上几个技术的关系与区别：hive、pig、hbase 关系与区别

HBase性能优化方法总结（一）：表的设计

Java 向Hbase表插入数据报（org.apache.hadoop.hbase.client.HTablePool$PooledHTable cannot be cast to org.apac

Lucene入门教程（转载）

hbase建索引的两种方式

Hbase shell 中能否通过filter实现的高级查询

为什么Hbase能实现快速的查询

Hadoop学习笔记—15.HBase框架学习（基础实践篇）

Hadoop学习笔记—15.HBase框架学习（基础知识篇）

【转】HBase技术介绍转载自 http://www.searchtb.com/2011/01/understanding-hbase.html

导航

统计

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

文章分类

阅读排行榜

评论排行榜

推荐排行榜

最新评论