python爬虫学习(一):requests第一血
前言
最近对爬虫比较感兴趣,在学习python之余也抽空学习,毕竟等自己老了之后也可以靠爬虫搞兼职。当然了,也看看机会能否转行爬虫吧哈哈。言归正传,开搞!
第一篇程序
需求:爬取搜狗首页的页面数据
# -*- encoding: utf-8 -*-
"""
@File : requests第一血.py
@Time : 2022/3/1 22:54
@Author : simon
@Email : 294168604@qq.com
@Software: PyCharm
"""
#- 需求:爬取搜狗首页的页面数据
import requests
if __name__ == "__main__":
#step_1:指定url
url = 'https://www.sogou.com/'
#step_2:发起请求
#get方法会返回一个响应对象
response = requests.get(url=url)
#step_3:获取响应数据.text返回的是字符串形式的响应数据
page_text = response.text
print(page_text)
#step_4:持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
fp.write(page_text)
print('爬取数据结束!!!')
执行结果
分类:
爬虫学习
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具