摘要: 引言HBase提供了Java Api的访问接口,掌握这个就跟Java应用使用RDBMS时需要JDBC一样重要,本文将继续前两篇文章中blog表的示例,介绍常用的Api。练习前的准备工作创建一个Maven工程,加入以下依赖:org.apache.hbasehbase0.90.2如果你的Maven库里还没有hbase,还需要配置下repositoryclouderahttps://repository.cloudera.com/content/groups/public确保HBase环境已启动且能连接到,将HBase环境的hbase-site.xml文件拷贝到上述工程的src/test/resou 阅读全文
posted @ 2013-08-09 23:29 一灯法师 阅读(253) 评论(0) 推荐(0) 编辑
摘要: 引言HBase提供了丰富的访问接口。• HBase Shell• Java clietn API• Jython、Groovy DSL、Scala• REST• Thrift(Ruby、Python、Perl、C++…)• MapReduce• Hive/Pig其中HBase Shell是常用的便捷方式,我们将结合本系列上一篇文章的理论分析来实践一把,依然采用blog表示例。首先你需要一个HBase的环境,如果需要自己搭建可以参考http://hbase.apache.org/book/quickstart.html 和http://hbase.apache.org/book/notsoqui 阅读全文
posted @ 2013-08-09 23:26 一灯法师 阅读(139) 评论(0) 推荐(0) 编辑
摘要: 引言团队中使用HBase的项目多了起来,对于业务人员而言,通常并不需要从头搭建、维护一套HBase的集群环境,对于其架构细节也不一定要深刻理解(交由HBase集群维护团队负责),迫切需要的是快速理解基本技术来解决业务问题。最近在XX项目轮岗过程中,尝试着从业务人员视角去看HBase,将一些过程记录下来,期望对快速了解HBase、掌握相关技术来开展工作的业务人员有点帮助。我觉得作为一个初次接触HBase的业务开发测试人员,他需要迫切掌握的至少包含以下几点:深入理解HTable,掌握如何结合业务设计高性能的HTable掌握与HBase的交互,反正是离不开数据的增删改查,通过HBase Shell命 阅读全文
posted @ 2013-08-09 22:36 一灯法师 阅读(371) 评论(0) 推荐(0) 编辑
摘要: 1. 简介HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable:一个结构化数据的分布式存储系统》。HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服务。2. HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为若干个列族/列簇(column family)。Row Keycolumn-family1column-family2column-family3column1column2colu 阅读全文
posted @ 2013-08-09 14:58 一灯法师 阅读(192) 评论(1) 推荐(0) 编辑
摘要: bpython 是一个很酷的python编辑器,加亮非常酷,使用简单,很炫的是我们在编写脚本的时候,可以随时上传到http://bpaste.net上,如:http://bpaste.net/show/121294/,这样方便我们做笔记。 阅读全文
posted @ 2013-08-09 14:18 一灯法师 阅读(237) 评论(0) 推荐(0) 编辑