摘要: K-Means需要设定一个簇心个数的参数,现实中,最常用于确定K数的方法,其实还是人手工设定。例如,当我们决定将衣服做成几个码的时候,其实就是在以人的衣服的长和宽为为特征进行聚类。所以,弄清楚我们更在意的是什么,能够引导选择更合适的K值。 有种方法能自动决定K值,也就是所谓的Elbow Met... 阅读全文
posted @ 2014-12-07 16:12 KevinHwang 阅读(1407) 评论(0) 推荐(0) 编辑
摘要: K-Means的中心初始化惯用方式是随机初始化。也就是说:从training set中随机挑选出K个作为中心,再进行下一步的K-Means算法。 这个方法很容易导致收敛到局部最优解,当簇个个数(K)较小(2<K<10)时,我们可以重复多次K-Means,记录下他们的每个的cost functi... 阅读全文
posted @ 2014-12-07 15:40 KevinHwang 阅读(195) 评论(0) 推荐(0) 编辑