层次化聚类

Hierarchical Clustering(HC).
本文讨论自下而上的聚合(Agglomerative)方法.

输入输出是什么?

输入: 无标签的数据
输出: 一棵层次化的分类树.

类似于selective search(SS)方法:

初始化:
- ss 利用Graph-base Segmentation方法对整张图片过度分割, 每一个分割出来的超像素都单独成一类.
- hc 将每一个数据点当作一个类别.
  计算不同类别间的两两相似度.
找出距离最近的一对类别, 将它们合为一类. 这样就得到了一个新的类别.
- SS将这一步得到的所有region作为proposal输出.
  然后重新计算相似度.
重复2直到所有的数据聚为一个类别.

整个过程中会形成一棵分类树. 像k-means这样的聚类算法需要事先选择一个类别数, 往往很麻烦. 而HC可以避免这个麻烦.
但无论是哪种聚类算法, 都需要一个类与类之间的相似度衡量. 这也是最关键最困难之处.

posted @ 2017-01-12 19:56 宁静是一种习惯阅读(575) 评论(0) 编辑收藏举报

刷新页面返回顶部