帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(inconsistent)(4)
inconsistent
inconsistency系数
语法
Y = inconsistent(Z)
Y = inconsistent(Z,d)
描述
Y = inconsistent(Z)对层次聚类树Z的每一条连接计算inconsistency系数,其中Z是由linkage函数生成的一个m-1行3列的矩阵。inconsistency系数通过比较每条连接的高度和同一层次其它连接高度的平均值来刻画每一个连接。这个系数的值越高,意味着这条连接相连的对象之间的相似度就越低。
Y = inconsistent(Z,d)对层次聚类树Z的每一条连接计算inconsistency系数到深度d。其中d是一个整数,标识的层次聚类树在计算中包含的层数。默认地,取d=2。
输出,Y,是一个m-1行4列的矩阵,形式如下:
列 | 描述 |
1 | 计算中包括的所有连接高度的平均。 |
2 | 计算中包括的所有连接高度的标准差。 |
3 | 计算中包括的所有连接数。 |
4 | inconsistency系数。 |
对每一条连接,k,inconsistency系数计算如下:
Y(k,4) = (z(k,3)-Y(k,1))/Y(k,2)
对于叶子节点,那些没有其它节点在它们下面的节点,设其inconsistency系数为0。
例子
计算Inconsistency系数
生成样本数据。
X = gallery('uniformdata',[10 2],12);
Y = pdist(X);
生成层次聚类树。
Z = linkage(Y,'single');
生成层次聚类树的系统树图。
dendrogram(Z)
对聚类树Z计算inconsistency系数到第3层。
W = inconsistent(Z,3)
W =
0.1313 0 1.0000 0
0.1386 0 1.0000 0
0.1463 0.0109 2.0000 0.7071
0.2391 0 1.0000 0
0.1951 0.0568 4.0000 0.9425
0.2308 0.0543 4.0000 0.9320
0.2395 0.0748 4.0000 0.7636
0.2654 0.0945 4.0000 0.9203
0.3769 0.0950 3.0000 1.1040