学习1:搜狗网页

1.requests模块:python中原生的一款基于网络请求的模块,功能强大,简单便捷。
作用:模拟浏览器发请求

 

2.如何使用:(requestes编码流程)
--指定url
--发起请求
--获取响应数据
--持久化存储

 

3.环境安装
pip install requests

4.实战编码
--需求:爬取搜狗首页的数据

 

import requests
#step1:指定url
url = "https://www.sogou.com/"
#step2:发起请求,get方法会返回一个响应对象
response = requests.get(url=url)
#step3:获取响应数据,text返回的是字符串形式的响应数据
page_text = response.text
#print(page_text)
#step4:持久化存储
with open('./sougou.html','w',encoding='utf-8') as fp:
fp.write(page_text)
print('爬取数据结束!')

posted @   萧六弟  阅读(59)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】
点击右上角即可分享
微信分享提示