requests中 .text 和 .content区别
1 import requests 2 3 url = 'https://www.baidu.com' 4 response = requests.get(url)
1.response.content: 这个是直接从网络上面抓取的数据,没有经过任何解码,所以是一个bytes类型,其实在硬盘上和在网络上传输的字符串都是bytes类型
2.response.text: 这个是str的数据类型,是requests库将response.content进行解码的字符串,解码需要指定一个编码方式,requests会根据自己的猜测来判断编码的方式,所以有时候可能会猜测错误,就会导致解码产生乱码,这时候就应该使用'response.content.decode('utf-8')'进行手动解码