2015 年 9月 19 日随笔档案 - Sea_Sky

2015年9月19日

摘要：前言：从IT跨度到DT,如今的数据每天都在海量的增长。面对如此巨大的数据，如何能让搜索引擎更好的工作呢？本文作为Hadoop系列的第二篇，将介绍分布式情况下搜索引擎的基础实现，即“倒排索引”。1.问题描述将所有不同文件里面的关键词进行存储，并实现快速检索。下面假设有3个文件的数据如下：fi... 阅读全文

posted @ 2015-09-19 00:24 Sea_Sky 阅读(5130) 评论(2) 推荐(0) 编辑

Sea_Sky

--自强不息，厚德载物--

公告

转载请注明出处！ About me