准确率和召回率
准确率和召回率
本来我开始以为准确率召回率这种东西不用记得太详细,用到的时候随手百度一下就行。但尝试搜了几篇文章评论区都有指正错误。正好手上有纸质书籍,遂决定码一码。
1.应用背景
在分类预测的机器学习任务中,样板实际类别数量可能是极不平衡的。例如,生产线上劣质产品识别,假如良品率有99%,而劣质产品只占1%。如果模型预测得到的良品率是80%,虽然纸面上的准确率很高,但是事实并非如此。
针对上述情况,准确率和召回率的定义就来了。
2.确切定义
混淆矩阵
预测为1 | 预测为0 | |
---|---|---|
实际为1 | f11(TP) | f10(FN) |
实际为0 | f01(FP) | f00(TN) |
召回率recall:
\[Recall = \frac{TP}{TP+FN} \]
描述:$$召回率=\frac{正样本预测正确数}{实际正样本数}$$
准确率 Accuracy:
\[Accuracy = \frac{TP+TN}{TP+TN+FP+FN} \]
描述:$$准确率=\frac{预测正确数}{样本总数}$$
精度Precision:
\[Precision = \frac{TP}{TP+FP} \]
描述:$$查准率=\frac{正样本预测正确数}{正样本预测数}$$
书本原文:
3.知识扩展
准确率和查准率是一种模型评价度量。除此外还有F1度量(精度和召回率的调和平均数)、Fβ、ROC曲线等。
解决数据集不平衡分类任务得方法有代价敏感学习,不充分抽样/过分抽样。