爬虫--Response类
Respondse类:Python中的response对象用于从服务器响应客户端请求。
属性:
status_code:获取服务器返回的状态码。
text:获取字符串的响应内容。
content:获取二进制形式的响应内容。
url:获取响应的最终URL。
request:获取请求方式。
headers:获取响应头。
encoding:设置或获取响应内容的编码格式,与text属性搭配使用。
cookies:获取服务器返回的Cookie
通过访问Response类对象的text属性可以获取字符串形式的网页源代码。
例:
1 2 3 4 | import requests base_url = 'https://www.baidu.com/' response = requests.get(url = base_url) print (response.text) |
为了保证获取的源代码中能过正常显示中文,这里需要通过Rsponse对象的enconding属性将编码格式设置为UTF-8
1 2 3 4 5 | import requests base_url = 'https://www.baidu.com/' response = requests.get(url = base_url) response.encoding = "utf-8" print (response.text) |
可使用content属性获取该图片对应的二进制数据,并将数据写入本地文件中
1 2 3 4 5 6 | import requests base_url = "https://www.baidu.com/img/pcyayunhuikaimushidoodle_35c0ef27c30a077f2e46ddb5db1993ef.gif" response = requests.get(url = base_url) print (response.content) #获取百度logo图片对应的二进制数据 with open (r 'D:\桌面\爬虫\top\baidu_logo.png' , 'wb' )as file : file .write(response.content) |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· Vue3状态管理终极指南:Pinia保姆级教程