情况1
问: 不登录可以翻页爬取,但只能爬取前几页
答:涉及到cookies验证,如果是auth认证的话,一页都不能爬取
情况2
问:爬取很多页后,显示系统繁忙
答:这是虚假的,开启cookies debug,找到请求直接的不同点(改点应该就是问题所在),大多数情况是sessid
COOKIES_ENABLED = True COOKIES_DEBUG = True