Scrapy如何在启动时向爬虫传递参数

高级方法:

一般方法:

运行爬虫时使用-a传递参数

scrapy crawl 爬虫名 -a key=values

然后在爬虫类的__init__魔法方法中获取kwargs

class Bang123Spider(RedisCrawlSpider):
    name = "bang123"
    allowed_domains = ["bang123.cn"]

    def __init__(self, *args, **kwargs):
        # kwargs可以传递参数,如何传递呢?运行爬虫命令时:scrapy crawl 爬虫名 -a key=values
        print(f"{args=}")
        print(f"{kwargs=}")
        super().__init__(*args, **kwargs)


方法2:

或则可以通过-s传递settings选项,然后在爬虫类中获取settings也可以!

scrapy crawl 爬虫名 -a key=values
posted @ 2023-07-17 11:44  蕝戀  阅读(16)  评论(0编辑  收藏  举报