摘要: Apache HBase是一个分布式的、面向列的开源数据库,它可以让我们随机的、实时的访问大数据。但是怎样有效的将数据导入到HBase呢?HBase有多种导入数据的方法,最直接的方法就是在MapReduce作业中使用TableOutputFormat作为输出,或者使用标准的客户端API,但是这些都不 阅读全文
posted @ 2016-10-15 01:28 木子李ykt 阅读(1004) 评论(0) 推荐(0) 编辑
摘要: 在HBase读写时,相同Cell(RowKey/ColumnFamily/Column相同)并不保证在一起,甚至删除一个Cell也只是写入一个新的Cell,它含有Delete标记,而不一定将一个Cell真正删除了,因而这就引起了一个问题,如何实现读的问题?要解决这个问题,我们先来分析一下相同的Cel 阅读全文
posted @ 2016-10-15 00:42 木子李ykt 阅读(3093) 评论(0) 推荐(0) 编辑