国务院办公厅放假通知信息获取

Python爬虫之正则提取信息

有时候我们需要用到根据当前日期(或指定日期)获取是否为节假日的情况,网上找的接口突然开始收费了,怎么办呢。我们就从国家官方网站获取信息吧。

需求:从中华人民共和国中央人民政府网站(www.gov.cn)获取2022年节假日安排 提取具体的放假日期和调休上班数据

第一步:首先确定目标数据

打开中华人民共和国中央人民政府网站(www.gov.cn)网站,进入搜索页面,搜索 “国务院办公厅关于2022年部分节假日安排的通知”

UntitledImage

然后点击搜索结果中的第一条通知,详情如下,至此找到目标内容。

UntitledImage

第二步:根据目标内容进行二次处理,从中提取出我们需要的数据。

分析:放假部分信息,[*年]*月*日至[*年][*月]*日放假;上班部分信息:*月*日(星期*)、*月*日(星期*)上班

第三步:根据上述逻辑开始转化为代码。

爬取结果如下:

UntitledImage

至此,节假日放假安排数据已获取到并进行了处理,以便我们进行其它操作。

 

posted @   逸乐太子  阅读(778)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
历史上的今天:
2015-06-11 Canvas制作天气预报走势图
点击右上角即可分享
微信分享提示