博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

K-means cluster algorithm介绍

Posted on 2011-12-28 16:11  月不识己  阅读(323)  评论(0编辑  收藏  举报
你要了解一下k-means到底是什么
k-means 算法的工作过程如下。首先从n个数据对象任意选择 k 个对象作为初始聚类中心,对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类。然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值),并且不断重复这一过程直到标准测度函数开始收敛为止。

一般都采用均方差作为标准测度函数。k means 对输入数据比较敏感,特别是初始聚类中心的选择。