nutch 很多url unfetched的原因
摘要:
bin/hadoop jar apache-nutch-1.7.job org.apache.nutch.crawl.CrawlDbReader crawl/crawldb -stats -sort会发现好多unfetched,原因是:nutch-default.xml对generate的时候进行... 阅读全文
posted @ 2014-08-28 19:51 雨渐渐 阅读(212) 评论(0) 推荐(0) 编辑