国务院办公厅放假通知信息获取
Python爬虫之正则提取信息
有时候我们需要用到根据当前日期(或指定日期)获取是否为节假日的情况,网上找的接口突然开始收费了,怎么办呢。我们就从国家官方网站获取信息吧。
需求:从中华人民共和国中央人民政府网站(www.gov.cn)获取2022年节假日安排 提取具体的放假日期和调休上班数据
第一步:首先确定目标数据
打开中华人民共和国中央人民政府网站(www.gov.cn)网站,进入搜索页面,搜索 “国务院办公厅关于2022年部分节假日安排的通知”
然后点击搜索结果中的第一条通知,详情如下,至此找到目标内容。
第二步:根据目标内容进行二次处理,从中提取出我们需要的数据。
分析:放假部分信息,[*年]*月*日至[*年][*月]*日放假;上班部分信息:*月*日(星期*)、*月*日(星期*)上班
第三步:根据上述逻辑开始转化为代码。
爬取结果如下:
至此,节假日放假安排数据已获取到并进行了处理,以便我们进行其它操作。