Scrapy框架爬取HTTP/2网站

scrapy本身是自带支持HTTP2的爬取：

需要把这个包安装一下

# 本身scrapy就是基于Twisted的，http2是一个拓展包
Twisted[http2] >=17.9.0

然后在settings.py中打开下载处理器

DOWNLOAD_HANDLERS = {
    "https": "scrapy.core.downloader.handlers.http2.H2DownloadHandler",
}

另外可以使用其他支持HTTP2的模块来利用中间件加载并返回数据，如：httpx，curl_ciff

posted @ 2023-07-17 11:47 运维爱背锅阅读(255) 评论(0) 收藏举报

刷新页面返回顶部

全网同号，关注《运维爱背锅》，用通俗易懂的方式学会运维！从零基础到进阶，分享运维技术和项目案例，一起探讨运维背锅人生！开启背锅之旅！