【机器学习】混淆矩阵及其绘制
混淆矩阵主要用于表示分类精度,利用横轴为预测结果纵轴为标准结果的表格图,可视化地展示算法的分类性能。
一个混淆矩阵的例子
其中第一类有10个,第二类有14个,第三类有21个。而实际的预测结果是第一类有一个样本错误预测为了第二类;第二类有5个错认为第一类,2个错认为第三类;第三类中有两个被错认为第一类,6个第二类。
:D | :D | class 1↓ | class 2↓ | class 3↓ |
---|---|---|---|---|
:D | :D | 实际结果↓ | 实际结果↓ | 实际结果↓ |
预测结果→ | class1 | 9 | 5 | 2 |
预测结果→ | class2 | 1 | 7 | 6 |
预测结果→ | class3 | 0 | 2 | 13 |
而所有正确预测的都在对角线上!通过混淆矩阵可以直观的看到算法对于哪些分类存在的问题。(行或者列代表预测结果/真实结果不影响最终矩阵的表现,因为不在对角线的元素才会显示算法的性能,交换行列矩阵只会装置对称)
混淆矩阵的可视化
我们在获得分类结果后,可以使用matplotlib来进行混淆矩阵的可视化,具体的计算方法可以参考scikit-learn,tensorflow,matlab
五种分类的情况下,假设混淆矩阵如下所示:
class = ['A','B','C','D','E'] #类别标签
confusion_matrix = [[9 1 3 4 0 0]
[2,13,1,3,4]
[1 4 10 0 13]
[3 1 1 17 0]
[0 0 0 1 14]]
#混淆矩阵
#confusion_matrix
import numpy as np
import matplotlib.pyplot as plt
classes = ['A','B','C','D','E']
confusion_matrix = np.array([(9,1,3,4,0),(2,13,1,3,4),(1,4,10,0,13),(3,1,1,17,0),(0,0,0,1,14)],dtype=np.float64)
plt.imshow(confusion_matrix, interpolation='nearest', cmap=plt.cm.Oranges) #按照像素显示出矩阵
plt.title('confusion_matrix')
plt.colorbar()
tick_marks = np.arange(len(classes))
plt.xticks(tick_marks, classes, rotation=-45)
plt.yticks(tick_marks, classes)
thresh = confusion_matrix.max() / 2.
#iters = [[i,j] for i in range(len(classes)) for j in range((classes))]
#ij配对,遍历矩阵迭代器
iters = np.reshape([[[i,j] for j in range(5)] for i in range(5)],(confusion_matrix.size,2))
for i, j in iters:
plt.text(j, i, format(confusion_matrix[i, j])) #显示对应的数字
plt.ylabel('Real label')
plt.xlabel('Prediction')
plt.tight_layout()
plt.show()
#iter:https://blog.csdn.net/zlf19910726/article/details/79172333
#np:https://blog.csdn.net/a486259/article/details/85238726
#array manipulate:https://blog.csdn.net/zhangchuang601/article/details/79626511
#color:https://matplotlib.org/users/colormaps.html
ref:
wiki:https://en.wikipedia.org/wiki/Confusion_matrix
scikit-learn:https://scikit-learn.org/stable/auto_examples/model_selection/plot_confusion_matrix.html
matlab:https://www.mathworks.com/help/deeplearning/ref/confusion.html
Tensorflow:https://tensorflow.google.cn/api_docs/python/tf/confusion_matrix
https://www.cnblogs.com/bonelee/p/8610205.html
https://blog.csdn.net/qq_28448117/article/details/78219549
https://blog.csdn.net/wowotuo/article/details/38262057
https://www.cnblogs.com/missidiot/p/9450662.html
https://baike.baidu.com/item/混淆矩阵/10087822?fr=aladdin
pic from ssyer.com