Python学习爬虫 requests库
下载图片
import requests response = requests.get('http://www.51gis.com.cn/static/upload/3e223daf9df6216f/f3e187dfc0e4143a.jpg') with open('51gis.jpg', 'wb') as f: f.write(response.content)
==================================
获得天气
import requests def getWeather(city): r = requests.get('http://wthrcdn.etouch.cn/weather_mini?city='+city) data = r.json()['data']['forecast'][0] return '%s:%s,%s'%(city,data['low'],data['high']) print(getWeather('北京'))
import requests class TiebaSpider(object): def __init__(self, tieba_name): self.tieba_name = tieba_name self.url_temp = "http://tieba.baidu.com/f?kw=" + tieba_name + "&ie=utf-8&pn={}" self.headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.75 Safari/537.36' } def parse_url(self, url): #'''访问url''' response = requests.get(url, headers=self.headers) return response.text def save_html(self, url_html, page_num): '''保存页面''' file_path = "《{}》-第{}页".format(self.tieba_name, page_num) with open(file_path + '.htm', 'w') as f: f.write(url_html) def get_url_list(self): '''构造url列表''' # 方法1 url_list = [] for i in range(10): url_list.append(self.url_temp.format(i * 50)) return url_list # 方法2 #return [self.url_temp.format(i * 50) for i in range(10)] def run(self): '''主要逻辑''' # 1 构造url url_list = self.get_url_list() # 2 访问url for url in url_list: url_html = self.parse_url(url) # 3 保存 page_num = url_list.index(url) + 1 # 获取页码 self.save_html(url_html, page_num) if __name__ == '__main__': name = input('请输入你想要爬取的论坛名称:') tb_spider = TiebaSpider(name) tb_spider.run()
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
2017-02-09 arcgis andriod 点击后变色
2017-02-09 Android基本功:手势