爬虫--Response类

Respondse类:Python中的response对象用于从服务器响应客户端请求。

属性:

status_code:获取服务器返回的状态码。

text:获取字符串的响应内容。

content:获取二进制形式的响应内容。

url:获取响应的最终URL。

request:获取请求方式。

headers:获取响应头。

encoding:设置或获取响应内容的编码格式,与text属性搭配使用。

cookies:获取服务器返回的Cookie

通过访问Response类对象的text属性可以获取字符串形式的网页源代码。

例:

1
2
3
4
import requests
base_url ='https://www.baidu.com/'
response = requests.get(url=base_url)
print(response.text)

  

为了保证获取的源代码中能过正常显示中文,这里需要通过Rsponse对象的enconding属性将编码格式设置为UTF-8

1
2
3
4
5
import requests
base_url ='https://www.baidu.com/'
response = requests.get(url=base_url)
response.encoding = "utf-8"
print(response.text)

  

 可使用content属性获取该图片对应的二进制数据,并将数据写入本地文件中

1
2
3
4
5
6
import requests
base_url="https://www.baidu.com/img/pcyayunhuikaimushidoodle_35c0ef27c30a077f2e46ddb5db1993ef.gif"
response = requests.get(url=base_url)
print(response.content)#获取百度logo图片对应的二进制数据
with open(r'D:\桌面\爬虫\top\baidu_logo.png','wb')as file:
    file.write(response.content)

  

 

posted @   小菜阿跃  阅读(93)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· Vue3状态管理终极指南:Pinia保姆级教程
点击右上角即可分享
微信分享提示