2012年6月23日

聚类(2)——层次聚类 Hierarchical Clustering

摘要: (转载请注明来源:http://blog.csdn.net/jiang1st2010/article/details/7685809)不管是GMM,还是k-means,都面临一个问题,就是k的个数如何选取?比如在bag-of-words模型中,用k-means训练码书,那么应该选取多少个码字呢?为了不在这个参数的选取上花费太多时间,可以考虑层次聚类。假设有N个待聚类的样本,对于层次聚类来说,基本步骤就是: 1、(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度; 2、寻找各个类之间最近的两个类,把他们归为一类(这样类的总数就少了一个); 3、重新计算... 阅读全文

posted @ 2012-06-23 11:09 刚开始 阅读(457) 评论(0) 推荐(0) 编辑

导航