摘要:
气象数据爬取与分析 前言 通过爬取2020年长治市的气温和天气状况来简要分析。 数据来源地址:http://lishi.tianqi.com/changzhi 而每月的数据,以2020年1月为例,链接为:http://lishi.tianqi.com/changzhi/202001.html 数据爬 阅读全文
摘要:
网页聚类 目标 爬取网页内容,提取其关键词,并进行聚类。 网页爬取 数据来源为央视新闻网,计划先提取本页面链接,然后根据链接请求页面内容。但是模拟发包请求数据后发现,接受到的内容中并没有包含想要的内容。于是查看其发送数据,发现传入数据的接口,其中包含几十条数据,里面包含网页的链接,直接复制数据,保存 阅读全文
摘要:
医学数据预处理 前言 任务 处理pO2,pCO2两个指标,按照采集时间的前后顺序,汇总每个病人每次住院期间的所有的pO2, pCO2指标值 数据集 数据来自: https://physionet.org/content/mimiciii-demo/1.4/ 中的CHARTEVENTS.csv和LAB 阅读全文