代码改变世界

k-means

2013-03-06 14:38  ggzwtj  阅读(237)  评论(0编辑  收藏  举报

k均值聚类算法是无监督的,这里均值的含义应该是指在确定新的聚类中心时的算法,具体的过程如下:

  1. 随机选择k个元素作为中心;
  2. 将剩下的元素归类到距离最近的聚类中心;
  3. 重新计算每个类的中心的位置:计算这个类中元素的平均值;
  4. 对所有元素重新归类,如果归类结果与之前不同,转3;
  5. 输出聚类结果;

需要注意的几点:

  1. 在不同的场景选择合适的距离计算方式;
  2. 一些特殊的场合中是不会知道聚类中心具体的值;

----- -- -

end.