python爬虫中Response [503]问题

503

最近我在爬取某图片网站，在爬取35页后就直接跳过去了一直到程序结束也没有报错，但是内容没有抓取下来。Debug调试后发现循环35页后爆出Response【503】

应该是ip被封禁了过一段时间就可以了
可以使用代理ip
也有可能是别的原因请自行判断，可以手动访问试一下

状态码503 表示服务器由于在维护或已经超载而无法响应。例如，如果某些线程或数据库连接池已经没有空闲则servlet会返回这个头信息。服务器可提供一个Retry-After头信息告诉客户端什么时候可以在试一次。
该错误是发生在接受响应的 HTTP 数据流。
该数据流包括状态编码，其值取决于 HTTP 协议。解析该数据流得到状态编码和其他有用信息。

返回 503有以下可能

1.表示服务器由于在维护或已经超载而无法响应
2.请求速度过快服务器判断是爬虫拉黑（有一点时间）
3.请求投header错误

可以从以下几方面入手

1.等待一段时间后再次请求
2.定时更换代理ip
3.检查请求头
4或者更换一个新的请求头

posted @ 2022-04-15 19:11 红尘破白阅读(1047) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 初用scrapy 报错503 Service Unavailable问题

· Python 爬虫处理429错误

· Nginx基础入门篇(3)—返回状态码详解

· 项目中常见的504问题分析

· 前端面试题：http状态码(200, 302, 304, 400, 403, 404, 405, 406, 500, 503)

阅读排行：
· winform 绘制太阳，地球，月球运作规律
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具

公告

昵称：红尘破白
园龄： 5年10个月
粉丝： 0
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

爬虫(1)

随笔档案

阅读排行榜