会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Sea_Sky
--自强不息,厚德载物--
博客园
首页
新随笔
联系
订阅
管理
2015年9月19日
Hadoop之倒排索引
摘要: 前言: 从IT跨度到DT,如今的数据每天都在海量的增长。面对如此巨大的数据,如何能让搜索引擎更好的工作呢?本文作为Hadoop系列的第二篇,将介绍分布式情况下搜索引擎的基础实现,即“倒排索引”。1.问题描述 将所有不同文件里面的关键词进行存储,并实现快速检索。下面假设有3个文件的数据如下:fi...
阅读全文
posted @ 2015-09-19 00:24 Sea_Sky
阅读(5130)
评论(2)
推荐(0)
编辑
公告
转载请注明出处!
About me