scrapy shell 交互窗口的使用

scrapy shell 交互窗口的使用

1、打开scrapy shell

在命令行cmd终端输入命令

# scrapy shell 网址 
scrapy shell http://www.baidu.com
# 注意网址不需要加引号,不是字符串。因为这里是终端。

2、利用shell调试代码

调试scrapy项目代码需要到scrapy项目顶级目录下打开scrapy shell

D:\>cd Demo

D:\Demo>scrapy shell http://www.baidu.com

shell便会自动导入该项目的配置和文件

view()

view(response)	# 用浏览器打开响应内容
# 用于检查网页的真实性

fetch()

fetch(url)		# 发送get请求,获取响应, 重新赋给response
# 可以检查网址是否可用
fetch(Request)	# 使用用请求对象发送get请求,并更新response
# 可以检查请求对象是否正确

settings

输入settings可以查看项目的配置,但不能在shell中修改。shell会返回一个字典显示详细的配置信息。

request

请求对象,可以查看请求头和cookies

request.headers		# 查看请求头,一个字典,字节类型数据
request.cookies		# 查看请求的cookies,一个字典

response

响应对象,是主要的操作对象,有很多方法

# 但有一个不可用
response.content	# scrapy的response不能得到二进制数据
# 只能获取文本
response.text
# 常用方法
# xpath()、get()、getall()
response.xpath().getall()

scrapy

构造请求对象

scrapy.Request(url)

spider、crawler

暂不清楚,待更新

posted @   流水自净  阅读(196)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
点击右上角即可分享
微信分享提示