摘要: 一.HBase的表结构和体系结构 1.HBase的表结构 把所有的数据存到一张表中。通过牺牲表空间,换取良好的性能。 HBase的列以列族的形式存在。每一个列族包括若干列 2.HBase的体系结构 主从结构: 主节点:HBase 从节点:RegionServer 包含多个Region,一个列族就是一 阅读全文
posted @ 2018-03-10 18:43 梦里南柯 阅读(969) 评论(0) 推荐(0) 编辑
摘要: package demo.wc; import java.util.ArrayList; import java.util.List; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.a... 阅读全文
posted @ 2018-03-10 15:42 梦里南柯 阅读(283) 评论(0) 推荐(0) 编辑
摘要: 一.介绍及数据准备 把文件ID对应到关键词的映射转换为关键词到文件ID的映射,每个关键词都对应着一系列的文件,这些文件中都出现这个关键词。 参考博客:https://www.cnblogs.com/zlslch/p/6440114.html 1.建立一个文件夹 2.在文件夹下建立三个文件,准备数据: 阅读全文
posted @ 2018-03-10 15:14 梦里南柯 阅读(555) 评论(0) 推荐(0) 编辑