摘要:
请求异常通常可分为: 网络异常 服务器异常 资源异常 ...... urllib.error python的urllib标准库的error子模块包含了URLError、HTTPError、ContentTooShortError3类,分别处理当URL无法打开时抛出的异常、当HTTP请求失败时抛出的异 阅读全文
摘要:
接着爬取上次提过的网站。当前页面需要登录才能获取信息,编写爬虫自动登录,自定义opener对象添加可以保存cookie的HTTPCookieHandler处理器来发送请求,将cookie保存成cookie.txt文件,再读取cookie并向服务器发送请求获取目标网页信息。目标url为http://w 阅读全文