随笔 - 66 文章 - 0 评论 - 2 阅读 - 26万

Python错误：scrapy框架中callback无法调用

问题描述：

当碰到scrapy框架中callback无法调用，直接略过了，别提多头疼了！

scrapy.Request(url, headers=self.header, callback=self.details)

原因分析：url 可能是被scrapy过滤掉了。

解决办法就是：

1、如果是被scrapy过滤掉了，那就只需要在这个 scrapy.Request() 函数中将参数放入dont_filter=True加入进去。

2、如果发现还是不行，就可能是因为allowed_domains这个赋值的时候赋值的是别的url，其实可以直接把这个注释掉直接不用。
3、仍然无法使用的话，首先那就要看网站协议了，直接在网站中查看输入：https://www.tencent.com/robots.txt 这里就可以看到

　　这里是没有限制的，那么的话按照前两个按照操作就可以正常的回调了，

4、如果不行就要打开配置文件settings.py，这里的False表示忽略网站的robots.txt协议，默认为True：

ROBOTSTXT_OBEY = False

　　把这个设置为False再试下就可以进行回调了。

posted on 2022-09-29 14:02 HandsomeFa 阅读(294) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Python错误：requests请求https网站报错SSLError

· Scrapy的callback进入不了回调方法

· scrapy.Request callback不执行

· 使用scrapy框架

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· 单线程的Redis速度为什么快？
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？
· 展开说说关于C#中ORM框架的用法！

2025年3月

日

一

二

三

四

五

六