摘要: k均值聚类 1)从N个文档随机选取K个文档作为质心2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类3)重新计算已经得到的各个类的质心4)迭代2~3步直至新的质心与原质心相等或小于指定阈值,算法结束 k均值聚类python代码实现: def kcluster(rows,distan 阅读全文
posted @ 2016-03-08 10:33 充实自己 阅读(296) 评论(0) 推荐(0) 编辑