摘要: 一、抓取流程概述1、nutch抓取流程当使用crawl命令进行抓取任务时,其基本流程步骤如下:(1)InjectorJob开始第一个迭代(2)GeneratorJob(3)FetcherJob(4)ParserJob(5)DbUpdaterJob(6)SolrIndexerJob开始第二个迭代(2)... 阅读全文
posted @ 2014-08-15 21:39 lujinhong 阅读(222) 评论(0) 推荐(0) 编辑