09 2022 档案

摘要:关联分析 概述:一种在大规模数据集中寻找有趣关系的任务。 这种关系形式:频繁项集或者关联规则。 频繁项集:经常出现在一块的物品集合。 关联规则:暗示物品之间可能存在很强的关系。 对频繁的度量: 支持度和可信度 支持度:数据集中包含该项集的记录所占的比例 可信度或者置信度: 针对诸如:{尿布}->{葡 阅读全文
posted @ 2022-09-15 16:36 酷酷的排球 阅读(363) 评论(0) 推荐(0) 编辑
摘要:关联分析 概述:一种在大规模数据集中寻找有趣关系的任务。 这种关系形式:频繁项集或者关联规则。 频繁项集:经常出现在一块的物品集合。 关联规则:暗示物品之间可能存在很强的关系。 对频繁的度量: 支持度和可信度 支持度:数据集中包含该项集的记录所占的比例 可信度或者置信度: 针对诸如:{尿布}->{葡 阅读全文
posted @ 2022-09-15 11:03 酷酷的排球 阅读(278) 评论(0) 推荐(0) 编辑
摘要:聚类算法 概述: 训练数据不存在类别标签信息,而且我们又需要根据数据特征将数据分成不同的类别, 聚类有时也被分为无监督分类, 和监督分类区别在于,聚类的训练数据没有对应的y值,而监督算法的数据有对应y值。 经典算法:K-均值聚类 K-均值聚类算法 优点:容易实现; 缺点:可能收敛到局部最小值,在大规 阅读全文
posted @ 2022-09-14 17:00 酷酷的排球 阅读(282) 评论(0) 推荐(0) 编辑
摘要:回归 线性回归 回归系数求解方法:常用最小二乘法 缺点:由于采用具有最小均方误差的无偏估计,可能出现欠拟合现象 解决办法: 局部加权线性回归 局部加权线性回归(Locally Weighted Linear Regression, LWLR) 思想:给待测点附近每一个点赋予一定的权重,在这个子集上基 阅读全文
posted @ 2022-09-14 13:34 酷酷的排球 阅读(147) 评论(0) 推荐(0) 编辑
摘要:集成算法(融合算法) 元算法(meta-algorithm) 思路:对其他算法进行组合。 使用集成算法时有多种形式: 不同算法的集成; 同一算法在不同设置下的集成; 数据集不同部分,分配给不同分类器之后的集成。 bagging(bootstrap aggregating) 自举汇聚法 定义:从原始数 阅读全文
posted @ 2022-09-13 17:55 酷酷的排球 阅读(299) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示