AUC面积、Gini系数、KS值

参考这篇文章:

https://www.cnblogs.com/zwt20120701/p/15557602.html

 

(1)P-R曲线是分别将查准率Precision(精确率)作为纵坐标,查全率Recall(召回率)作为横坐标作的图。

(2)ROC曲线、AUC面积、Gini系数、KS值 都是基于真阳率TPR(又叫查全率、召回率、捕获率、命中率)假阳率FPR(误诊率)两个重要的指标得来的。其中AUC面积、Gini系数是直接在ROC曲线基础上进一步得到的。

 

是指受试者工作特征曲线/接收器操作特性曲线(receiver operating characteristic curve),是反应敏感性和特异性连续变量的综合指标,利用构图法揭示敏感性和 特异性的相互关系,它通过将连续变量设定出多个不同的临界值(阈值),从而计算出一系列敏感性和特异性,再以敏感性(命中率)为纵坐标,特异性(误诊率)为横坐标绘制成曲线,曲线下的面积(AUC)越大,诊断准确性越高。最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。

 

 

KS(Kolmogorov-Smirnov)值定义为TPR与FPR的差的最大值。

KS值 =max(TPR−FPR)

一般,希望模型有较大的KS值,意味着模型有较强的区分能力。但是也不是越大越好,如果KS值超过0.75,往往表示模型有异常。

KS值对应的模型预测概率即最优阈值,选择此预测概率值作为0、1分类的分界线,可使模型取得最优分类效果。

 

(1)KS值<0.2 ,一般认为模型区分能力较弱;

(2)KS值在[0.2 ,0.3]之间模型有一定区分能力;商业实践中能在这个区间就挺不错了。

(3)KS值在[0.3 ,0.5]之间,模型具有较强的区分能力。

 

 

 

Gini系数指ROC曲线与y=x(红线)围成的面积和中线之上的面积的(0.5)比例。AUC和Gini系数的换算关系为:

Gini系数 =2*AUC -1

 

 

posted @ 2022-03-13 20:01  blcblc  阅读(694)  评论(0编辑  收藏  举报