摘要: Apriori算法简单实现 前言 以如下数据为例,来说明算法的运行过程,找出其频繁项。数据中每一行代表一条数据,每一列可以代表待关联的事物,比如每个客户购买的每个商品 [['a','c','e'], ['b','d'], ['b','c'], ['a','b','c','d'], ['a','b'] 阅读全文
posted @ 2022-02-18 17:35 启林O_o 阅读(67) 评论(0) 推荐(0) 编辑
摘要: 针对天气数据的决策树建立 目标 如下图所示,利用图中天气数据建立决策树,但是对于温度与湿度进行预处理,即将温度与湿度分为4个范围,以这0-3这四个值代替原来的值作为特征。对应关系如下所示: [60,70)对应0 [70,80)对应1 [80,90)对应2 [90,100)对应3 建立决策树 树的建立 阅读全文
posted @ 2022-02-18 17:34 启林O_o 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 使用Kmeans算法对数据进行聚类 前言 数据 Waveform数据来自该链接:https://archive.ics.uci.edu/ml/machine-learning-databases/waveform/ 其中每条数据已经进行了分类,分为了0,1,2类,这些标签位于每一条数据的最后。 图片 阅读全文
posted @ 2022-02-18 17:34 启林O_o 阅读(351) 评论(1) 推荐(1) 编辑
摘要: 网页聚类 目标 爬取网页内容,提取其关键词,并进行聚类。 网页爬取 数据来源为央视新闻网,计划先提取本页面链接,然后根据链接请求页面内容。但是模拟发包请求数据后发现,接受到的内容中并没有包含想要的内容。于是查看其发送数据,发现传入数据的接口,其中包含几十条数据,里面包含网页的链接,直接复制数据,保存 阅读全文
posted @ 2022-02-18 17:33 启林O_o 阅读(216) 评论(0) 推荐(0) 编辑
摘要: 气象数据爬取与分析 前言 通过爬取2020年长治市的气温和天气状况来简要分析。 数据来源地址:http://lishi.tianqi.com/changzhi 而每月的数据,以2020年1月为例,链接为:http://lishi.tianqi.com/changzhi/202001.html 数据爬 阅读全文
posted @ 2022-02-18 17:33 启林O_o 阅读(233) 评论(1) 推荐(0) 编辑
摘要: 医学数据预处理 前言 任务 处理pO2,pCO2两个指标,按照采集时间的前后顺序,汇总每个病人每次住院期间的所有的pO2, pCO2指标值 数据集 数据来自: https://physionet.org/content/mimiciii-demo/1.4/ 中的CHARTEVENTS.csv和LAB 阅读全文
posted @ 2022-02-18 17:32 启林O_o 阅读(242) 评论(0) 推荐(0) 编辑