层次化聚类
Hierarchical Clustering(HC).
本文讨论自下而上的聚合(Agglomerative)方法.
输入输出是什么?
输入: 无标签的数据
输出: 一棵层次化的分类树.
算法思想
类似于selective search(SS)方法:
- 初始化:
- ss 利用Graph-base Segmentation方法对整张图片过度分割, 每一个分割出来的超像素都单独成一类.
- hc 将每一个数据点当作一个类别.
计算不同类别间的两两相似度.
- 找出距离最近的一对类别, 将它们合为一类. 这样就得到了一个新的类别.
- SS将这一步得到的所有region作为proposal输出.
然后重新计算相似度.
- SS将这一步得到的所有region作为proposal输出.
- 重复2直到所有的数据聚为一个类别.
整个过程中会形成一棵分类树. 像k-means这样的聚类算法需要事先选择一个类别数, 往往很麻烦. 而HC可以避免这个麻烦.
但无论是哪种聚类算法, 都需要一个类与类之间的相似度衡量. 这也是最关键最困难之处.
如何衡量取聚类效果?
(END)
Daniel的学习笔记
浙江大学计算机专业15级硕士在读, 方向: Machine Learning, Deep Learning, Computer Vision.
blog内容是我个人的学习笔记, 由于个人水平限制, 肯定有不少错误或遗漏. 若发现, 欢迎留言告知, Thanks!
Daniel的学习笔记
浙江大学计算机专业15级硕士在读, 方向: Machine Learning, Deep Learning, Computer Vision.
blog内容是我个人的学习笔记, 由于个人水平限制, 肯定有不少错误或遗漏. 若发现, 欢迎留言告知, Thanks!