2013年3月13日

python Kmeans算法

摘要: python的多元高斯生成起来好麻烦,所以只好用matlab先生成测试数据然后再进行测试了。cnblogs上面写公式好麻烦,所以就不多写了。上代码吧。kmeans的基本思想就是通过迭代的方法,更新不同类别的的数据均值,从而达到聚类的目的,因为需要先固定一个均值μiold,然后再通过梯度的方法更新μ值。这就天然的包含了EM的思想。kmeans对起始的均值设定比较敏感,因此并不能保证最终能够收敛到一个好的结果。而且考虑到它需要计算每个点到中心点的距离,计算复杂度非常高,因此,当数据点非常多,而且聚类数目比较多的时候,就会造成速度非常慢的结果。#!/usr/bin/env pythonimport 阅读全文

posted @ 2013-03-13 10:56 long0x0 阅读(4454) 评论(0) 推荐(0) 编辑

导航