摘要: weka提供了11种聚类算法,常用的有kmeans 和EM,weka的simpleKmeans是最简单的聚类方法,距离是计算欧几里德距离,但是新版本的weka是可以置入自己的计算距离的公式的。EM聚类的效率很低,建议如果不是实验情况,不要使用。主要说一下simpleKmeans聚类。SimpleKmeans聚类参数很简单,这里不再赘述,文档里面写的很清楚。用图形界面的情况下,聚类之后,在左下方的result list栏里,右键,有很多选项,其中visualize cluster assignment可以看聚类之后的结果,在这个visualize界面,有一个save,是可以把类标号添加到每一行数 阅读全文
posted @ 2012-10-24 16:51 fbiswt 阅读(2896) 评论(0) 推荐(0) 编辑