k均值算法非常简单且使用广泛,但是存在的缺陷有: 
1. K值需要预先给定;

  属于预先知识,很多情况下K值的估计非常困难。 
2. K-Means算法对初始选取的聚类中心点是敏感的;

  不同的随机种子点得到的聚类结果完全不同 
3. K均值算法并不适合所有的数据类型;

  不能处理非球形簇、不同尺寸和不同密度的簇。 
4. 对离群点的数据进行聚类时,K均值也存在问题,这种情况下,离群点检测和删除有很大的帮助。