爬虫之urllib.error模块

error模块简介

我们在爬虫的时候发请求的时候难免出现错误，如访问不到服务器或者访问被禁止等等，

出错了之后urllib将错误信息封装成了一个模块对象中，这个模块就叫error模块

error的分类

分为URLError和HTTPError。

URLError是OSError的一个子类

有以下错误的时候错误信息就会被封装在URLError里：

无网络
有网络但是由于种种原因导致服务器连接失败

而如果能够连接服务器但是服务器返回了错误代码如404，403等等（400以上），那么催无信息就会被封装在HTTPError里

URLError与HttpError的区别和关系

区别：

URLError封装的错误信息一般是由网络引起的，包括url错误
HTTPError封装的错误信息一般是服务器返回了错误状态码

关系：

URLError是OSERROR的子类，HTTPError是URLError的子类

使用方法

error类是在捕获错误信息的时候使用，而且一般我们也需要进行捕获，因为你很难确定访问请求一定不会出现错误

from urllib import request
from urllib import error
 
url = 'http://baiduuuu.com'
 
try:
    res = request.Request(url)
    response = request.urlopen(res)
 
    print(response.read().decode())
 
except error.HTTPError as he:
    print(he)
    # print(he.reason)
 
except error.URLError as ue:
    print(ue)
    # print(ue.reason)
 
except Exception as e:
    print(e)

注意：由于HTTPError是URLError的子类，所以捕获的时候HTTPError要放在URLError的上面

posted @ 2018-05-09 23:56 人生不如戏阅读(437) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

公告

不必遗憾。
若是美好，叫做精彩。
若是糟糕，叫做经历。

昵称：人生不如戏
园龄：2年6个月
粉丝：263
关注：15

昵称：人生不如戏
园龄： 7年3个月
粉丝： 177
关注： 8

2025年3月

日

一

二

三

四

五

六

随笔分类

随笔档案

文章分类

Linux(2)

while True:just do it

爬虫之urllib.error模块

error模块简介

error的分类

URLError与HttpError的区别和关系

使用方法

公告

不必遗憾。
若是美好，叫做精彩。
若是糟糕，叫做经历。

搜索

常用链接

我的标签

随笔分类

随笔档案

文章分类

阅读排行榜

评论排行榜

推荐排行榜

最新评论

error模块简介

error的分类

URLError与HttpError的区别和关系

使用方法

公告

不必遗憾。 若是美好，叫做精彩。 若是糟糕，叫做经历。

搜索

常用链接

随笔档案

不必遗憾。
若是美好，叫做精彩。
若是糟糕，叫做经历。