聚类——认识K-means算法
作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/
一、聚类与分类
聚类: 无监督学习。聚类是在预先不知道欲划分类的情况下,根据信息相似度原则进行信息聚类的一种方法。 目的是使得属于同类别的对象之间的差别尽可能的小,而不同类别上的对象的差别尽可能的大。
分类: 监督学习,即每个训练样本的数据对象已经有类标识,通过学习可以形成表达数据对象与类标识间对应的知识。 目的是根据样本数据形成的类知识并对源数据进行分类,进而也可以预测未来数据的归类。
聚类分析图(K-means算法)
分类(KNN)
二、K-means算法
1.概述
K均值聚类算法是一种经典的划分聚类算法,也是一种迭代的聚类算法,在迭代的过程中不断移动聚类中心,直到聚类准则函数收敛为止。