10-赵志勇机器学习-meanshift
(草稿)
meanshift 也是一种聚类方法。
优点在于:不需要提前指定类型数。
缺点就是计算量大
过程:(最一般的做法,没有使用核函数)
1. 逐点迭代,设置为位置中心
2. 计算所有点到位置中心的距离
3. 计算位置的质心(平均)
4. 位置中心的质心的距离够小就停止,该位置中心点就属于(质心)类。(使用质心来标记所属类别)
5. 位置中心的质心的距离不够小,位置中心移动到质心,继续
6. 每个点都被标记了(标记为某个质心),统计一下,有几种标记。聚类完成。
过程:(使用核函数)
1. 逐点迭代,设置为位置中心
2. 计算所有点到位置中心的距离
3. 计算位置的漂移中心(所有点坐标的加权平均,权值是由距离和高斯核确定的)
4. 位置中心的质心的距离够小就停止,该位置中心点就属于(质心)类。(使用质心来标记所属类别)
5. 位置中心的质心的距离不够小,位置中心移动到质心,继续
6. 每个点都被标记了(标记为某个质心),统计一下,有几种标记。聚类完成。
https://blog.csdn.net/google19890102/article/details/51030884