吴---------requests类库 作业总结

1,在用get方法时,可在网址后加一个问号?表示传递参数

例:repose=requests.get('http;//httpbin.org/get?name=germey&age=22')

2 ,也可在get中设置params参数(要求后面添加的参数为字典的形式)

例:repose=requests.get('http;//httpbin.org/getparams={'name':'germy','age'=22}

3  ,在获取源代码得到的是杂乱无章的时候,可用josn,即名字.json或json.loads(名字.text)

4,用get方式获取图片时,如果直接用名字.text输出网页源代码时,得到的是乱码,要获取图片则要获取图片的二进制代码,可以用名字.content

(如何把网页上的图片爬取下来?在get网址后,用with open(‘新建一个文件名.图片后缀’,‘wb’)as**:      再用**.write(获取图片二进制源码的方式)

5,在爬取网页数据时,如若不被允许,可以仿造浏览器来爬取

6,请求要有请求头,有了请求头会更像是浏览器在访问数据,找到网页中F12的请求头代码,,创建一个变量,使得变量={‘请求头名’:‘请求头代码’}

7,在get获得网页时get(‘网址’,变量名=变量名)

8,状态码判断:在访问网络不成功时,可用exit()if not 名字.status_code==200

                              else print(‘Request Successful’)表示如果状态码为200访问不成功时,则退出,否则则输出Request Successful

9,如何把一个图片上传到网络?

设置一个变量为files,files={‘files’:open(‘图片名’,‘rb’)}

value值为操作系统open接口类型(上传文件,图片均用post)

名字=request.post(‘网址’,files=files)

10,访问网站出现不安全提示时,可用package下urllib3类库下的警告类库-------urllib3.disable_warnings()再用get访问(‘网址’,verify=False)

其中verify=False是指不要出现验证方式

11,访问超时的设置,可以设置访问时间超过多久就退出,用requests类库中Exception类,再导入Timeout

名字=requests.get(‘网址’,timeout=1)访问该网址超过1秒就停止,输出状态码

 

posted on 2018-10-11 17:20  扁儿  阅读(108)  评论(0编辑  收藏  举报

导航