题目描述:
试述真正例率(TPR)、假正例率(FPR)与查准率(P)、查全率(R)之间的联系。
解答:
定义
\[TPR = \frac{TP}{TP+FN}=\frac{预测为正例中真的是正例的个数}{样本中的正例数}
\]
\[FPR = \frac{FP}{TP+FN}=1-TPR=\frac{预测为正例实际为负例的个数}{样本中的正例数}
\]
\[P = \frac{TP}{TP+FP}=\frac{预测为正例中真的是正例的个数}{预测为正例的个数}
\]
\[R = \frac{TP}{TP+FN}=TPR = \frac{预测为正例中真的是正例的个数}{样本中的正例数}
\]
所以真正例率就是查全率,两者相等,真正例率(查全率)增大,查准率就降低(至少不会增加,下文不再区分这种不变的情形,不增就认为是降低)。
假正例就是把负例预测成正例,则减少假正例率,则查准率也增加(因为避免了把负例预测成正例),查全率降低。举个例子,分类一些人是否感染新冠病毒,健康为正例,感染为反例。为了减少假正例率,即减少把感染误判为未感染,那就把一些不太确定的也判为感染并进行隔离。这样可能有部分健康的人也被隔离了,所以查全率下降。判为正例(健康)的人,几乎都是健康的,所以查准率高。