摘要: 今天要对一个1000个个记录,每个记录有n个属性的文本进行聚类,采用的是二分k均值方法。算法思想:我参考了Pang-Ning Tan数据挖掘导论里P317相对于kmeans的优点是不受其初始质心的影响。#coding utf-8#python 3.4#2015-4-3#Fitz Yin #yinr... 阅读全文
posted @ 2015-04-03 20:05 Fitz_Yin 阅读(1098) 评论(0) 推荐(0) 编辑