如何选择K-Means中K的值

  K-Means需要设定一个簇心个数的参数,现实中,最常用于确定K数的方法,

其实还是人手工设定。例如,当我们决定将衣服做成几个码的时候,其实就是在以

人的衣服的长和宽为为特征进行聚类。所以,弄清楚我们更在意的是什么,能够

引导选择更合适的K值。

  有种方法能自动决定K值,也就是所谓的Elbow Method(DIVFRP层次聚类etc.)。

它的idea是将不同K值及其相对应的cost function值画出来,将转折明显的地方K值设置

为最合适的K。如图:

但实际上,它并不是总是好用的。有时整个变换曲线并没有明显的转折点。

关于如何实现Elbow Method未来我会专门写一篇随笔来介绍,并给出相应的python实现。

posted @ 2014-12-07 16:12  KevinHwang  阅读(1417)  评论(0编辑  收藏  举报