问题:图片解析后url路径解析发生改变

背景:解析 站长素材首页的图片

看程序执行

在我执行完程序之后显示爬取成功 但是并没有爬取到图片

找错过程

把settings中的LOG_LEVEL = "ERROE"改成WARNING

 

就发现了警告信息

于是我又进行输出url

发现了本身爬取的url没有问题 但是用Request解析的时候就发现了解析错了

就找到了问题的的根源

使用Request对象构造请求,URL中的特殊字符没有被正确处理

改正方法

url = 'https://' + re.sub(r'\\', '/', item['src'])

在使用Request发送请求前,对url进行处理

这样就处理成功了

posted @ 2024-03-03 21:02  会秃头的小白  阅读(16)  评论(0编辑  收藏  举报