帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(cophenet)(3)

cophenet


Cophenetic 相关系数

语法


  c = cophenet(Z,Y)

  [c,d] = cophenet(Z,Y)

描述


c = cophenet(Z,Y)计算Z表示的层次聚类树的cophenetic相关系数。Z是linkage函数的输出。Y包含构造Z所用的距离和差异度,它也是pdist函数的输出。Z是一个m-13列的矩阵,其中第三列是距离信息。Y是一个长度为m*(m-1)的向量。

[c,d] = cophenet(Z,Y)返回cophenetic距离d,是和Y一样的底层的三角距离向量。

一个聚类树的cophenetic相关系数被定义为从树中得到的cophenetic距离和用来生成树的原始距离(或差异度)之间的线性相关系数。因此,这是一个衡量这颗树是否忠实地展现观测值之间的差异度的方法。

两个观测值之间的cophenetic距离在系统树图上表示为两个观察值首次连接的线的高度。这个高度就是由这条线合并的两个子簇之间的距离。

这个输出值,c,是cophenetic相关系数。对于一个高质量的解决方案,这个值的大小应该非常接近1。这个方法可以用于比较用不同算法得到的可供选择的聚类方案。

Z(:,3)和Y之间的cophenetic相关系数定义如下:

其中:

Yij是在Y中对象ij之间的距离。

Zij是对象ij之间的cophenetic距离,来自Z(:,3)。

yz分别为Y和Z(:,3)的平均值。

例子


  X = [rand(10,3); rand(10,3)+1; rand(10,3)+2];

  Y = pdist(X);

  Z = linkage(Y,'average');  

  % 计算差异度和cophenetic距离之间的斯皮尔曼秩相关系数

  r = corr(Y',D',type',spearman')

  r =

    0.8279

posted @ 2015-09-23 14:32  永远爱数学  阅读(301)  评论(0编辑  收藏  举报