聚类 sklearn contingency matrix 权变矩阵 解释

>>> from sklearn.metrics.cluster import contingency_matrix
>>> x = ["a", "a", "a", "b", "b", "b"]
>>> y = [0, 0, 1, 1, 2, 2]
>>> contingency_matrix(x, y)
array([[2, 1, 0],
       [0, 1, 2]])

输出数组的第一行指示存在三个样本,其真实簇为“ a”。 其中两个在预测聚类0中,一个在1中,一个都不在2中。
第二行表示存在三个样本,其真实聚类为“ b”。 其中,没有一个在预测聚类0中,一个在1中,两个在2中。

https://scikit-learn.org/stable/modules/clustering.html#clustering-performance-evaluation 2.3.10.8

posted @ 2021-05-07 11:52  陈玉兰  阅读(818)  评论(0编辑  收藏  举报