2012 年 6月 23 日随笔档案 - 刚开始

2012年6月23日

聚类(2)——层次聚类 Hierarchical Clustering

摘要：（转载请注明来源：http://blog.csdn.net/jiang1st2010/article/details/7685809）不管是GMM，还是k-means，都面临一个问题，就是k的个数如何选取？比如在bag-of-words模型中，用k-means训练码书，那么应该选取多少个码字呢？为了不在这个参数的选取上花费太多时间，可以考虑层次聚类。假设有N个待聚类的样本，对于层次聚类来说，基本步骤就是： 1、（初始化）把每个样本归为一类，计算每两个类之间的距离，也就是样本与样本之间的相似度； 2、寻找各个类之间最近的两个类，把他们归为一类（这样类的总数就少了一个）； 3、重新计算... 阅读全文

posted @ 2012-06-23 11:09 刚开始阅读(457) 评论(0) 推荐(0) 编辑

聚类(2)——层次聚类 Hierarchical Clustering

导航