(参考)爬虫3-Requests库的主要方法

Requests库的7个主要方法：

方法	说明
requests.request()	构造一个请求，支撑以下各方法的基础方法
requests.get()	获取HTML网页的主要方法，对应于HTTP的GET
requests.head()	获取HTML网页头信息的方法，对应HTTP的HEAD
requests.post()	向HTML网页提交POST请求的方法，对应于HTTP的POST
requests.put()	向HTTP网页提交PUT请求的方法，对应于HTTP的PUT
requests.patch()	向HTTP网页提交局部修改请求，对应于HTTP的PATCH
requests.delete()	向HTTP页面提交删除请求，对应于HTTP的DELETE

HTTP协议：超文本传输协议

URL是通过HTTP协议存取资源的Internet路径，一个url对应一个数据资源

HTTP对资源的操作有6个方法，与上表对应。

PATCH和PUT的区别：

HTTP协议方法与Requests库方法具有功能的一致性

head方法用很少的流量获取网络的概要信息

Requests库主要方法解析：

1、requests.request(method,url,**kwargs)

method:表示get head 等方法

url 表示路径

**kwargs 表示其他13个参数控制访问的参数，均为可选项

比如params 对url进行修改的字段

data：字典、字节序列或文件，Request的内容

json：JSON格式的数据，作为Request的内容

kv={'key1':'value1'}
r=requests.request('POST','http://python123.io/ws',json=kv)

headers：字典，HTTP定制头

hd={'user-agent':'Chrome/10'}#表示将user-agent改为Chrome/10
r=requests.request('POST','http://python123.io/ws',headers=hd)

还有其他的一些字段，在这里不详述。

掌握get和head方法即可。

一定要用try except保证正常访问以及异常处理。

posted @ 2018-03-27 21:02 歪胡子的日常阅读(139) 评论(0) 收藏举报

刷新页面返回顶部

invictus maneo