【转】scrapy爬取深度设置

转自 http://blog.csdn.net/u012150179/article/details/38226103

 

通过在settings.py中设置DEPTH_LIMIT的值可以限制爬取深度,这个深度是与start_urls中定义url的相对值。也就是相对 url的深度。例如定义url为:http://www.domz.com/game/,DEPTH_LIMIT=1那么限制爬取的只能是此url下一级 的网页。深度大于设置值的将被ignore。

如图:

posted @ 2015-10-18 14:32  fukan  阅读(1007)  评论(0编辑  收藏  举报