摘要: http://www.cnblogs.com/zjfstudio/p/3913549.htmlHadoop学习笔记(8) ——实战 做个倒排索引 倒排索引是文档检索系统中最常用数据结构。根据单词反过来查在文档中出现的频率,而不是根据文档来,所以称倒排索引(Inverted Index)。结构如下:... 阅读全文
posted @ 2014-09-12 10:14 mmcmmc 阅读(226) 评论(0) 推荐(0) 编辑
摘要: http://www.cnblogs.com/zjfstudio/p/3887551.htmlHadoop学习笔记(7) ——高级编程 从前面的学习中,我们了解到了MapReduce整个过程需要经过以下几个步骤: 1.输入(input):将输入数据分成一个个split,并将split进一步拆成。 ... 阅读全文
posted @ 2014-09-12 09:55 mmcmmc 阅读(120) 评论(0) 推荐(0) 编辑
摘要: http://www.cnblogs.com/zjfstudio/p/3877094.html#undefinedHadoop学习笔记(6) ——重新认识Hadoop 之前,我们把hadoop从下载包部署到编写了helloworld,看到了结果。现是得开始稍微更深入地了解hadoop了。 Hado... 阅读全文
posted @ 2014-09-12 09:33 mmcmmc 阅读(172) 评论(0) 推荐(0) 编辑