摘要: 昨天爬取了丁香园的实时更新的动态信息,但是里面有好多对项目无关的信息(如下图),所以就要进行数据的清洗, 想到了python的正则表达式,就对正则表达式进行了学习,现进行如下总结: 首先,python中的正则表达式大致分为以下几部分: 元字符 模式 函数 re 内置对象用法 分组用法 环视用法 一、 阅读全文
posted @ 2020-02-09 22:57 K_Y 阅读(106) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2020-02-09 00:33 K_Y 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 今天接到一个新任务,爬取新冠肺炎各个城市的每日新增确诊,疑似、治愈人数,并制作迁移图像,我首先想到的是丁香医生这个网站 (https://ncov.dxy.cn/ncovh5/view/pneumonia_timeline?whichFrom=peopleapp) 查看源码发现,代码构造很简单,就觉 阅读全文
posted @ 2020-02-09 00:05 K_Y 阅读(135) 评论(0) 推荐(0) 编辑