随笔分类 -  18 nutch

摘要:对搜索引擎的理解:我们并没有google 的源代码,因此学习搜索引擎Nutch是个不错的选择。了解一个大型分布式的搜索引擎如何工作是一件让人很受益的事情。在写 Nutch的过程中,从学院派和工业派借鉴了很多知识:比如,Nutch的核心部分目前已经被重新用 Map Reduce 实现了。Map Reduce 是一个分布式的处理模型,最先是从 Google 实验室提出来的。并且 Nutch 也吸引了很多研究者,他们非常乐于尝试新的搜索算法,因为对Nutch 来说,这是非常容易实现扩展的。 阅读全文
posted @ 2013-08-09 09:38 Tim&Blog 阅读(177) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示