Scrapyd 简易食用教程
Scrapyd安装:
#服务端 pip install scrapyd #客户端 pip install scrapyd-client
打开命令行,输入
scrapyd
访问 127.0.0.1:6800 即可看到web界面
部署scrapy项目
在scrapy项目目录下,有一个scrapy.cfg的配置文件:
# Automatically created by: scrapy startproject # # For more information about the [deploy] section see: # https://scrapyd.readthedocs.io/en/latest/deploy.html [settings] default = xxx.settings [deploy:test] url = http://localhost:6800/ project = xxx
test——项目名 (随便)
project 工程名 (你创建 项目时使用的名字)
windows环境下配置:
到python虚拟环境下找到 Scripts/scrapyd-deploy
新建scrapyd-deploy.bat
这里路径需要自己修改
"E:\python_venv\envTest\Scripts\python.exe" "E:\python_venv\envTest\Scripts\scrapyd-deploy" %1 %2 %3 %4 %5 %6 %7 %8 %9
然后,进入到我们爬虫的根目录,运行scrapyd-deploy
把爬虫项目上传到服务端
准备工作:查看当前目录下的 spider
(base) $ scrapy list xxxx1 xxxx2
- 执行打包命令
scrapyd-deploy 部署名称 -p 项目名称
如scrapyd-deploy bushu -p test
可以去网页中127.0.0.1:6800查看爬虫运行状态 - 停止爬虫
curl http://localhost:6800/cancel.json -d project=scrapy项目名称 -d job=运行ID
- 删除scrapy项目
curl http://localhost:6800/delproject.json -d project=scrapy项目名称 - 查看有多少个scrapy项目在api中
curl http://localhost:6800/listprojects.json - 查看指定的scrapy项目中有多少个爬虫
curl http://localhost:6800/listspiders.json?project=scrapy项目名称
总结几个请求url
1、获取状态 http://127.0.0.1:6800/daemonstatus.json 2、获取项目列表 http://127.0.0.1:6800/listprojects.json 3、获取项目下已发布的爬虫列表 http://127.0.0.1:6800/listspiders.json?project=myproject 4、获取项目下已发布的爬虫版本列表 http://127.0.0.1:6800/listversions.json?project=myproject 5、获取爬虫运行状态 http://127.0.0.1:6800/listjobs.json?project=myproject 6、启动服务器上某一爬虫(必须是已发布到服务器的爬虫) http://127.0.0.1:6800/schedule.json (post方式,data={"project":myproject,"spider":myspider}) 7、删除某一版本爬虫 http://127.0.0.1:6800/delversion.json (post方式,data={"project":myproject,"version":myversion}) 8、删除某一工程,包括该工程下的各版本爬虫 http://127.0.0.1:6800/delproject.json(post方式,data={"project":myproject})
本文发表于博客园《始識的技术笔记》,作者为 zichliang(hybpjx/始識)
作者博客:https://www.cnblogs.com/zichliang
本文地址:https://www.cnblogs.com/zichliang/p/18581322
本文原创授权为:署名 - 非商业性使用 - 禁止演绎,协议普通文本 | 协议法律文本
作者博客:https://www.cnblogs.com/zichliang
本文地址:https://www.cnblogs.com/zichliang/p/18581322
本文原创授权为:署名 - 非商业性使用 - 禁止演绎,协议普通文本 | 协议法律文本
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律