摘要: BEGIN: 爬虫系列: 爬虫笔记(一):Requests 爬虫笔记(二):爬取网页的通用代码框架 一、HTTP协议概念 HTTP协议(Hypertext Transfer Protocol):超文本传输协议。HTTP是一个基于“请求与响应”(用户发出请求服务器响应请求)模式的、无状态(每次请求间没 阅读全文
posted @ 2020-11-16 21:52 Gangpei 阅读(226) 评论(0) 推荐(0) 编辑
摘要: BEGIN: 爬虫系列: 爬虫笔记(一):Requests 爬虫笔记(三):HTTP协议及Requests库方法 上节提到r.raise_for_status()异常方法,这里将给出爬虫的通用代码框架,并将该异常方法运用到代码中。 爬取网页的通用代码框架 import requests def ge 阅读全文
posted @ 2020-11-16 20:38 Gangpei 阅读(275) 评论(0) 推荐(0) 编辑
摘要: BEGIN: 爬虫系列: 爬虫笔记(二):爬取网页的通用代码框架 爬虫笔记(三):HTTP协议及Requests库方法 一、准备 1、requests安装 pip install requests 2、测试(IDLE) import requests r = requests.get("http:/ 阅读全文
posted @ 2020-11-16 20:19 Gangpei 阅读(138) 评论(0) 推荐(0) 编辑