FEKM: fast and extract out-of-core k-means clustering

;;Kmeans的时间复杂度是O(m)（《数据挖掘导论》，m是数据规模）。但是，算法在每次迭代过程中需要计算每个点到各个质心的距离，于是距离函数需要被计算km次，k是质心个数，而计算欧氏距离的过程如果看成是求一个n次多项式的函数值的过程，就算运用秦九韶算法也需要n次乘法和n次加法。当数据规模很大甚至作为核外数据集时，这显然是不能接受的。;;前人的许多研究都围绕近似展开，以牺牲准确度为代价来加速算法。这篇文章提出的FEKM算 ...

posted @ 2012-12-12 12:21 chng 阅读(261) 评论(0) 编辑收藏举报