摘要: 请求异常通常可分为: 网络异常 服务器异常 资源异常 ...... urllib.error python的urllib标准库的error子模块包含了URLError、HTTPError、ContentTooShortError3类,分别处理当URL无法打开时抛出的异常、当HTTP请求失败时抛出的异 阅读全文
posted @ 2024-09-18 23:11 松鼠q 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 接着爬取上次提过的网站。当前页面需要登录才能获取信息,编写爬虫自动登录,自定义opener对象添加可以保存cookie的HTTPCookieHandler处理器来发送请求,将cookie保存成cookie.txt文件,再读取cookie并向服务器发送请求获取目标网页信息。目标url为http://w 阅读全文
posted @ 2024-09-18 22:53 松鼠q 阅读(3) 评论(0) 推荐(0) 编辑