摘要: 背景 聚类属于无监督学习,我们前面所讲的逻辑回归,决策树都是有类别标签y的,也就是说样本中给出了样本的类别y。而聚类的样本却没有给样本的类别y,只有样本的特征x。聚类的目的是找到每个样本x潜在的类别y,并将相同类别y的样本x放在一起。 kmeans kmeans中聚类算法中使用的最广泛的算法之一。我 阅读全文
posted @ 2017-05-31 16:46 段星星 阅读(539) 评论(0) 推荐(0) 编辑
摘要: 背景 决策树是数据挖掘中一种最基本的分类与回归方法,与其他算法相比,决策树的原理浅显易懂,计算复杂度较小,而且输出结果易于理解,因此在实际工作中有着广泛的应用 基本算法 决策树分类算法的流程如下: 1. 初始化根结点,此时所有的观测样本均属于根结点 2. 根据下文中介绍的划分选择,选择当前最优的划分 阅读全文
posted @ 2017-05-31 16:43 段星星 阅读(2334) 评论(0) 推荐(0) 编辑