历史天气爬虫
1 # coding: utf-8 2 import re 3 from bs4 import BeautifulSoup 4 import requests 5 6 7 def main(city='zhengzhou', ymonth='202301'): 8 9 headers = { 10 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36' 11 } 12 13 url = F'http://www.tianqihoubao.com/lishi/{city}/month/{ymonth}.html' 14 content = requests.get(url=url, headers=headers) 15 soup = BeautifulSoup(content.text, 'lxml') 16 weather = soup.find_all('tr') 17 18 # 逐日处理 19 for info in weather: 20 info = str(info).replace(' ', '').replace('\r\n', '') 21 info = info.replace('\n', '') 22 info = re.sub(r'<[^>]+>', ' ', info) 23 info = re.sub(r' {2,}', ' ', info.strip()) 24 print(info)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具