Scrapy如何在启动时向爬虫传递参数
高级方法:
一般方法:
运行爬虫时使用-a传递参数
scrapy crawl 爬虫名 -a key=values
然后在爬虫类的__init__魔法方法中获取kwargs
class Bang123Spider(RedisCrawlSpider):
name = "bang123"
allowed_domains = ["bang123.cn"]
def __init__(self, *args, **kwargs):
# kwargs可以传递参数,如何传递呢?运行爬虫命令时:scrapy crawl 爬虫名 -a key=values
print(f"{args=}")
print(f"{kwargs=}")
super().__init__(*args, **kwargs)
方法2:
或则可以通过-s传递settings选项,然后在爬虫类中获取settings也可以!
scrapy crawl 爬虫名 -a key=values
本文来自博客园,作者:运维爱背锅,转载请注明原文链接:https://www.cnblogs.com/juelian/p/17559678.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步