2018年8月24日

Python 爬虫_Urllib库的详解

摘要: Urllib库的详解1. Urllib是python内置的HTTP请求库 包含4个模块: urllib.request(请求模块); urllib.error(异常处理模块); urllib.parse(url解析模块); urllib.robotparse(robots.text解析模块) @ur 阅读全文

posted @ 2018-08-24 17:34 你是不夜星空 阅读(191) 评论(0) 推荐(0) 编辑

爬虫基本原理1

摘要: 爬虫基本原理 1. request请求方式: 主要有GET; POST;另外还有HEAD, PUT,DELETE,OPTIONS等; 请求URL:又称资源定位符,类似网页文档,图片,视频都可以用URL唯一来确定; 请求头:包含USER-AGENT,HOST,COOKIES等信息 请求体: 请求时额外 阅读全文

posted @ 2018-08-24 17:33 你是不夜星空 阅读(136) 评论(0) 推荐(0) 编辑

导航