scrapy下载大文件失败问题

由于scrapy并发请求过多，默认情况下会同时下载16个文件，而连接时间默认超过三分钟就会丢失。就是说如果三分钟之内你的网速没法支持你同时下载完16个文件的话就会造成这个问题。

解决方法就是在settings.py中将默认并发连接数调小或者将timeout时间调大

CONCURRENT_REQUESTS = 2
DOWNLOAD_TIMEOUT=1800

此时并发请求被调成2，等待时间被1800秒，一般的视频和图片是没有问题了。

posted @ 2024-03-13 10:02 珊瑚贝博客阅读(54) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

· scrapy使用文件管道FilesPipeline下载视频

· Scrapy 请求并发数设置

· Learning-Scrapy-中文版（二）

· scrapy简介

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· winform 绘制太阳，地球，月球运作规律
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 上周热点回顾（3.3-3.9）
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人

昵称：珊瑚贝博客
园龄： 9年5个月
粉丝： 3
关注： 0

2025年3月

日

一

二

三

四

五

六