爬虫遇到的情况

情况1

问: 不登录可以翻页爬取,但只能爬取前几页

答:涉及到cookies验证,如果是auth认证的话,一页都不能爬取

情况2

问:爬取很多页后,显示系统繁忙

答:这是虚假的,开启cookies debug,找到请求直接的不同点(改点应该就是问题所在),大多数情况是sessid

COOKIES_ENABLED = True
COOKIES_DEBUG = True

 

posted @ 2019-11-14 17:17  市丸银  阅读(123)  评论(0编辑  收藏  举报