学习1:搜狗网页
1.requests模块:python中原生的一款基于网络请求的模块,功能强大,简单便捷。
作用:模拟浏览器发请求
2.如何使用:(requestes编码流程)
--指定url
--发起请求
--获取响应数据
--持久化存储
3.环境安装
pip install requests
4.实战编码
--需求:爬取搜狗首页的数据
import requests
#step1:指定url
url = "https://www.sogou.com/"
#step2:发起请求,get方法会返回一个响应对象
response = requests.get(url=url)
#step3:获取响应数据,text返回的是字符串形式的响应数据
page_text = response.text
#print(page_text)
#step4:持久化存储
with open('./sougou.html','w',encoding='utf-8') as fp:
fp.write(page_text)
print('爬取数据结束!')
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】