K-means学习心得

机器学习中的一种分类方法。被分类数据是一个n维的向量集合,即n维点集。K代表点集最终被分成K个簇,即K类。means意思是分类方式是向K个中心点聚集,即离某个中心点最近的点为一簇。
步骤:

  1. 从点集中挑选K个点作为初始的中心点,最直接的是随机挑选。还有其他的选择方式,这影响着聚类迭代过程的收敛速度
  2. 剩余的点计算与K个中心点的距离,得到最近的那个点,作为自己的中心点,加入该点的簇中
  3. 对K个簇重新计算中心点,即各簇中向量的均值
  4. 比较步骤3前后中心点是否发生变化,若不变或者已达到最大迭代次数则输出中心点,否则继续迭代,重复步骤2-4
posted @ 2017-09-02 11:47  如牛饮水  阅读(732)  评论(0编辑  收藏  举报