博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2012年5月22日

摘要: Written by Hao C., Hadoop Special Interest Group. 这段时间看了下Nutch1.4的源码,并尝试着结合solr和tomcat搭个搜索引擎,目前还没完成,但是也有些东西可以一记,希望对自己对别人都有所帮助。由于时间关系,而且很多细节问题还不是很理解,以下内容并没有经过精心组织,准备等搜索引擎搭好后再重构一下。 网上有一些文章是讲Nutch的每一步是做什么的,基本上还是很好理解的,所以在这里就先不赘述了。我这里主要写一下Nutch1.4中几个主要的类是做什么的,建议先了解一下Nutch的基本组成和MapReduce的原理。在本文的最下面还有一个FAQ 阅读全文

posted @ 2012-05-22 17:10 Hadoop-scutmstcSIG 阅读(418) 评论(1) 推荐(0) 编辑