帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(cophenet)(3)
cophenet
Cophenetic 相关系数
语法
c = cophenet(Z,Y)
[c,d] = cophenet(Z,Y)
描述
c = cophenet(Z,Y)计算Z表示的层次聚类树的cophenetic相关系数。Z是linkage函数的输出。Y包含构造Z所用的距离和差异度,它也是pdist函数的输出。Z是一个m-1行3列的矩阵,其中第三列是距离信息。Y是一个长度为m*(m-1)的向量。
[c,d] = cophenet(Z,Y)返回cophenetic距离d,是和Y一样的底层的三角距离向量。
一个聚类树的cophenetic相关系数被定义为从树中得到的cophenetic距离和用来生成树的原始距离(或差异度)之间的线性相关系数。因此,这是一个衡量这颗树是否忠实地展现观测值之间的差异度的方法。
两个观测值之间的cophenetic距离在系统树图上表示为两个观察值首次连接的线的高度。这个高度就是由这条线合并的两个子簇之间的距离。
这个输出值,c,是cophenetic相关系数。对于一个高质量的解决方案,这个值的大小应该非常接近1。这个方法可以用于比较用不同算法得到的可供选择的聚类方案。
Z(:,3)和Y之间的cophenetic相关系数定义如下:
其中:
Yij是在Y中对象i和j之间的距离。
Zij是对象i和j之间的cophenetic距离,来自Z(:,3)。
y和z分别为Y和Z(:,3)的平均值。
例子
X = [rand(10,3); rand(10,3)+1; rand(10,3)+2];
Y = pdist(X);
Z = linkage(Y,'average');
% 计算差异度和cophenetic距离之间的斯皮尔曼秩相关系数
r = corr(Y',D',type',spearman')
r =
0.8279