scrapy 爬网站显示 Filtered offsite request to 错误.

爬取zol 网站图片,无法抓取.

在 setting.py 文件中设置日志记录等级

LOG_LEVEL= 'DEBUG'

LOG_FILE ='log.txt'

查看日志发现报

2015-11-07 14:43:43+0800 [meizitu] DEBUG: Filtered offsite request to 'bbs.zol.com.cn': <GET http://bbs.zol.com.cn/dcbbs/d14_134253.html>

这条日志记录有点奇怪果断上网百度 ,找到答案

官方对这个的解释，是你要request的地址和allow_domain里面的冲突，从而被过滤掉。可以停用过滤功能。

yield Request(url, callback=self.parse_item, dont_filter=True)

转载地址‘https://blog.csdn.net/feifly329/article/details/49702063’

posted @ 2018-07-16 15:01 蚂蚁iiiiiii 阅读(238) 评论(0) 收藏举报

刷新页面返回顶部

黑色的削笔刀