吴---------requests类库作业总结

1，在用get方法时，可在网址后加一个问号？表示传递参数

例：repose=requests.get('http；//httpbin.org/get?name=germey&age=22')

2 ，也可在get中设置params参数（要求后面添加的参数为字典的形式）

例：repose=requests.get('http；//httpbin.org/get，params={'name':'germy','age'=22}

3 ，在获取源代码得到的是杂乱无章的时候，可用josn，即名字.json或json.loads(名字.text)

4，用get方式获取图片时，如果直接用名字.text输出网页源代码时，得到的是乱码，要获取图片则要获取图片的二进制代码，可以用名字.content

（如何把网页上的图片爬取下来？在get网址后，用with open（‘新建一个文件名.图片后缀’，‘wb’）as**: 再用**.write(获取图片二进制源码的方式）

5，在爬取网页数据时，如若不被允许，可以仿造浏览器来爬取

6，请求要有请求头，有了请求头会更像是浏览器在访问数据，找到网页中F12的请求头代码，，创建一个变量，使得变量={‘请求头名’：‘请求头代码’}

7，在get获得网页时get（‘网址’，变量名=变量名）

8，状态码判断：在访问网络不成功时，可用exit（）if not 名字.status_code==200

　　　　　　　　　　else print（‘Request Successful’）表示如果状态码为200访问不成功时，则退出，否则则输出Request Successful

9，如何把一个图片上传到网络？

设置一个变量为files，files={‘files’：open（‘图片名’，‘rb’）}

value值为操作系统open接口类型（上传文件，图片均用post）

名字=request.post(‘网址’，files=files)

10，访问网站出现不安全提示时，可用package下urllib3类库下的警告类库-------urllib3.disable_warnings()再用get访问（‘网址’，verify=False）

其中verify=False是指不要出现验证方式

11，访问超时的设置，可以设置访问时间超过多久就退出，用requests类库中Exception类，再导入Timeout

名字=requests.get（‘网址’，timeout=1）访问该网址超过1秒就停止，输出状态码

posted on 2018-10-11 17:20 扁儿阅读(108) 评论(0) 编辑收藏举报

刷新页面返回顶部

扁儿