历史天气爬虫

复制代码
 1 # coding: utf-8
 2 import re
 3 from bs4 import BeautifulSoup
 4 import requests
 5 
 6 
 7 def main(city='zhengzhou', ymonth='202301'):
 8 
 9     headers = {
10         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36'
11     }
12 
13     url = F'http://www.tianqihoubao.com/lishi/{city}/month/{ymonth}.html'
14     content = requests.get(url=url, headers=headers)
15     soup = BeautifulSoup(content.text, 'lxml')
16     weather = soup.find_all('tr')
17 
18     # 逐日处理
19     for info in weather:
20         info = str(info).replace(' ', '').replace('\r\n', '')
21         info = info.replace('\n', '')
22         info = re.sub(r'<[^>]+>', ' ', info)
23         info = re.sub(r' {2,}', ' ', info.strip())
24         print(info)
复制代码

 

posted @   ddzhen  阅读(11)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示