Python:Scrap爬虫过程中遇到的各种错误

1、KeyError: 'Spider not found: BDS'

原因:settings.py中缺少了几项与spider名字配置相关的项:

BOT_NAME = 'BDS'
SPIDER_MODULES = ['County.spiders']
NEWSPIDER_MODULE = 'County.spiders'

2、 ValueError(f'Missing scheme in request url: {self._url}')

原因:路径没有使用正确,比如忘记加前缀https://

3、在用shell对网页进行测试时,一些网页后缀被当做了异常变量处理了

 

 解决方法:在进入shell模式之后,用fetch再爬取一次URL就可以了,这时候页面的内容保存在变量response

posted @ 2021-04-08 16:49  ShineLe  阅读(296)  评论(0)    收藏  举报