摘要: 1、分类:具有类别标签,将数据集根据分到相应的类别 聚类:没有类别标签,将数据集根据他们的相似度分为不同的簇 2、监督学习:用于学习的数据集都是输入\输出数据对,学习的任务是找到输入与输出的对应规则 非监督学习:用于学习的数据集只有输入,学习的任务是对于数据进行分析,找到输出 3、分类与回归: 分类 阅读全文
posted @ 2014-12-24 02:05 李闹闹童鞋 阅读(209) 评论(0) 推荐(0) 编辑
摘要: 一、聚类算法 1、常见的聚类算法(待) 二、K均值 1、步骤 (1)随机选取K个质心 (2)分别计算每个样本与这K个质心的距离,将样本分配到距其最近的簇 (3)对K个簇分别取均值,重新选择质心。所谓的取均值就是分别对每个特征取均值,这样就会计算出一个新的数据点,将此数据点作为质心 (4)重复(2)- 阅读全文
posted @ 2014-12-24 01:38 李闹闹童鞋 阅读(155) 评论(0) 推荐(0) 编辑