爬虫_urllib_URLError和HTTPError(异常处理)

简介

1.HTTPError类是URLError类的子类

2.http错误:http错误是针对浏览器无法连接到服务器而增加出来的错误提示。引导并告诉浏览者该页面是哪里出现了问题

3.通过urllib发送请求的时候,有可能会发送失败,这个时候如果想让你的代码更加健壮性,可以通过try-except进行捕获异常,异常有两类,URLError和HTTPError。

 

复制代码
# 爬虫中的异常处理

import urllib.request
import urllib.error
#正确地址
# url = 'https://blog.csdn.net/weixin_39709134/article/details/124601777'
# 错误地址
#url = 'https://blog.csdn.net/weixin_39709134/article/details/124601777error'
# 错误的url
url = 'http://www.goudan11.com'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.67 Safari/537.36'
}
try:
    request = urllib.request.Request(url=url,headers=headers)
    response = urllib.request.urlopen(request)
    content = response.read().decode('utf-8')
    print(content)
except urllib.error.HTTPError:
    print('请求地址错误')
except urllib.error.URLError:
    print('请求url错误')
复制代码

 

posted @   创客未来  阅读(420)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
点击右上角即可分享
微信分享提示