摘要: 假设有N个待聚类的样本,对于层次聚类来说,步骤: 1、(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度; 2、寻找各个类之间最近的两个类,把他们归为一类(这样类的总数就少了一个); 3、重新计算新生成的这个类与各个旧类之间的相似度; 4、重复2和3直到所有样本点都归 阅读全文
posted @ 2017-08-02 23:20 dear_diary 阅读(414) 评论(0) 推荐(0) 编辑
摘要: 1.归类: 聚类(clustering) 属于非监督学习 (unsupervised learning) 无类别标记(class label) 2.举例: 3. K-means 算法: 3.1 Clustering 中的经典算法,数据挖掘十大经典算法之一 3.2 算法接受参数 k ;然后将事先输入的 阅读全文
posted @ 2017-08-02 22:54 dear_diary 阅读(398) 评论(0) 推荐(0) 编辑