摘要: 前言: 从IT跨度到DT,如今的数据每天都在海量的增长。面对如此巨大的数据,如何能让搜索引擎更好的工作呢?本文作为Hadoop系列的第二篇,将介绍分布式情况下搜索引擎的基础实现,即“倒排索引”。1.问题描述 将所有不同文件里面的关键词进行存储,并实现快速检索。下面假设有3个文件的数据如下:fi... 阅读全文
posted @ 2015-09-19 00:24 Sea_Sky 阅读(5123) 评论(2) 推荐(0) 编辑

转载请注明出处! About me