Fork me on GitHub
摘要: 不管是GMM,还是k-means,都面临一个问题,就是k的个数如何选取?比如在bag-of-words模型中,用k-means训练码书,那么应该选取多少个码字呢?为了不在这个参数的选取上花费太多时间,可以考虑层次聚类。 假设有N个待聚类的样本,对于层次聚类来说,基本步骤就是: 1、(初始化)把每个样 阅读全文
posted @ 2017-10-13 19:53 stardsd 阅读(5521) 评论(0) 推荐(0) 编辑
摘要: 凝聚法分层聚类中有一堆方法可以用来算两点(pair)之间的距离:欧式,欧式平方,manhattan等,还有一堆方法可以算类(cluster)与类之间的距离,什么single-linkage、complete-linkage、还有这个ward linkage。(即最短最长平均,离差平方和) 其他的好像 阅读全文
posted @ 2017-10-13 18:59 stardsd 阅读(19253) 评论(0) 推荐(1) 编辑