准确率和召回率

准确率和召回率

本来我开始以为准确率召回率这种东西不用记得太详细,用到的时候随手百度一下就行。但尝试搜了几篇文章评论区都有指正错误。正好手上有纸质书籍,遂决定码一码。

1.应用背景

在分类预测的机器学习任务中,样板实际类别数量可能是极不平衡的。例如,生产线上劣质产品识别,假如良品率有99%,而劣质产品只占1%。如果模型预测得到的良品率是80%,虽然纸面上的准确率很高,但是事实并非如此。

针对上述情况,准确率和召回率的定义就来了。

2.确切定义

混淆矩阵

预测为1 预测为0
实际为1 f11(TP) f10(FN)
实际为0 f01(FP) f00(TN)

召回率recall:

\[Recall = \frac{TP}{TP+FN} \]

描述:$$召回率=\frac{正样本预测正确数}{实际正样本数}$$

准确率 Accuracy:

\[Accuracy = \frac{TP+TN}{TP+TN+FP+FN} \]

描述:$$准确率=\frac{预测正确数}{样本总数}$$

精度Precision:

\[Precision = \frac{TP}{TP+FP} \]

描述:$$查准率=\frac{正样本预测正确数}{正样本预测数}$$

书本原文:

3.知识扩展

准确率和查准率是一种模型评价度量。除此外还有F1度量(精度和召回率的调和平均数)、Fβ、ROC曲线等。

解决数据集不平衡分类任务得方法有代价敏感学习,不充分抽样/过分抽样。

posted @ 2021-03-29 13:31  菲克纽斯  阅读(389)  评论(0编辑  收藏  举报