Scrapy如何在启动时向爬虫传递参数

高级方法:

一般方法:

运行爬虫时使用-a传递参数

scrapy crawl 爬虫名 -a key=values

然后在爬虫类的__init__魔法方法中获取kwargs

class Bang123Spider(RedisCrawlSpider):
    name = "bang123"
    allowed_domains = ["bang123.cn"]

    def __init__(self, *args, **kwargs):
        # kwargs可以传递参数,如何传递呢?运行爬虫命令时:scrapy crawl 爬虫名 -a key=values
        print(f"{args=}")
        print(f"{kwargs=}")
        super().__init__(*args, **kwargs)


方法2:

或则可以通过-s传递settings选项,然后在爬虫类中获取settings也可以!

scrapy crawl 爬虫名 -a key=values
posted @   运维爱背锅  阅读(26)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
💬
评论
📌
收藏
💗
关注
👍
推荐
🚀
回顶
收起
  1. 1 404 not found REOL
404 not found - REOL
00:00 / 00:00
An audio error has occurred.