层次聚类

---恢复内容开始---

层次聚类

 思想:只要一个区域中的点的密度大于某个阈值,就把它加到与之相近的聚类中去。


 

DBSCAN:

定义:

(1)对象的ε-邻域:对于给定半径ε内的区域。

(2)核心对象:对于给定数目m,如果一个对象的ε-邻域内至少包含m个对象,则称该对象为核心对象。

(3)直接密度可达:给定一个对象集合D,如果对象p在对象q的ε-邻域内,且对象对象q是核心对象,那么我们称对象p是从对象q直接密度可达的。

(4)密度可达:如果存在一个对象链p1,p2,...,pn,p1=p,pn=q,pi+1是从pi关于ε和m直接密度可达的,则对象p是从对象q密度可达的。

(5)密度相连:如果对象集合D中存在一个对象o,使得对象p和对象q是从对象o关于ε和m密度可达,则对象p和对象q关于ε和m密度相连。

(6)簇:密度相连的对象的最大集合。

(7)噪声:不包含在任何簇中的对象。

如果一个点p的ε邻域包含多于m个对象,则创建一个p作为核心对象的簇,然后DBSCAN反复寻找这些核心对象直接密度可达的对象,这个过程可能会涉及密度可达簇的合并,当没有新的点可以被添加到任何簇的时候该过程结束。


 

密度最大值聚类:

局部密度ρ:ρi=Σj K(dij-dc)

K(x)=1(x<0)

K(x)=0(其他)

高局部密度点距离:密度高于对象i中所有对象到对象i的最近的距离。

(对于密度最大的对象,设置它的高局部密度点距离为max(dij))

簇中心:有着比较大的局部密度和很大的高密度距离的点

异常点:高密度距离较大但局部密度较小的点

---恢复内容结束---

posted on 2017-11-30 20:06  hester-tang  阅读(265)  评论(0编辑  收藏  举报

导航