python网络爬虫1.1requests库
python网络爬虫1.1requests库
标签(空格分隔): python 网络爬虫
r = requests.get(url)
获取含目标网 页信息的request对象,即respond。
此处的r表示respond,服务器的返回对象,该对象包括许多属性。下面五个是最常用的属性,务必牢记。r.status_code
HTTP请求的返回状态,200表示成功,其余表示失败(比如404)- r.text
HTTP的字符串形式,即页面的源码。- r.encoding
从HTTP heading中猜测响应内容的编码方式- r.apparent_encoding 从响应的内容文本中分析出的编码方式
- r.content
返回页面的二进制形式