scrapy shell 交互窗口的使用
scrapy shell 交互窗口的使用
目录
1、打开scrapy shell
在命令行cmd终端输入命令
# scrapy shell 网址
scrapy shell http://www.baidu.com
# 注意网址不需要加引号,不是字符串。因为这里是终端。
2、利用shell调试代码
调试scrapy项目代码需要到scrapy项目顶级目录下打开scrapy shell
D:\>cd Demo
D:\Demo>scrapy shell http://www.baidu.com
shell便会自动导入该项目的配置和文件
view()
view(response) # 用浏览器打开响应内容
# 用于检查网页的真实性
fetch()
fetch(url) # 发送get请求,获取响应, 重新赋给response
# 可以检查网址是否可用
fetch(Request) # 使用用请求对象发送get请求,并更新response
# 可以检查请求对象是否正确
settings
输入settings可以查看项目的配置,但不能在shell中修改。shell会返回一个字典显示详细的配置信息。
request
请求对象,可以查看请求头和cookies
request.headers # 查看请求头,一个字典,字节类型数据
request.cookies # 查看请求的cookies,一个字典
response
响应对象,是主要的操作对象,有很多方法
# 但有一个不可用
response.content # scrapy的response不能得到二进制数据
# 只能获取文本
response.text
# 常用方法
# xpath()、get()、getall()
response.xpath().getall()
scrapy
构造请求对象
scrapy.Request(url)
spider、crawler
暂不清楚,待更新
如果觉得本文有用,万望看官慷慨解囊,不吝打赏,激励本编提供更加优质的内容
[点击进行打赏](https://www.cnblogs.com/52note/p/16507868.html)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix