AUC面积、Gini系数、KS值
参考这篇文章:
https://www.cnblogs.com/zwt20120701/p/15557602.html
(1)P-R曲线是分别将查准率Precision(精确率)作为纵坐标,查全率Recall(召回率)作为横坐标作的图。
(2)ROC曲线、AUC面积、Gini系数、KS值 都是基于真阳率TPR(又叫查全率、召回率、捕获率、命中率)和假阳率FPR(误诊率)两个重要的指标得来的。其中AUC面积、Gini系数是直接在ROC曲线基础上进一步得到的。
是指受试者工作特征曲线/接收器操作特性曲线(receiver operating characteristic curve),是反应敏感性和特异性连续变量的综合指标,利用构图法揭示敏感性和 特异性的相互关系,它通过将连续变量设定出多个不同的临界值(阈值),从而计算出一系列敏感性和特异性,再以敏感性(命中率)为纵坐标,特异性(误诊率)为横坐标绘制成曲线,曲线下的面积(AUC)越大,诊断准确性越高。最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。
KS(Kolmogorov-Smirnov)值定义为TPR与FPR的差的最大值。
KS值 =max(TPR−FPR)
一般,希望模型有较大的KS值,意味着模型有较强的区分能力。但是也不是越大越好,如果KS值超过0.75,往往表示模型有异常。
KS值对应的模型预测概率即最优阈值,选择此预测概率值作为0、1分类的分界线,可使模型取得最优分类效果。
(1)KS值<0.2 ,一般认为模型区分能力较弱;
(2)KS值在[0.2 ,0.3]之间模型有一定区分能力;商业实践中能在这个区间就挺不错了。
(3)KS值在[0.3 ,0.5]之间,模型具有较强的区分能力。
Gini系数指ROC曲线与y=x(红线)围成的面积和中线之上的面积的(0.5)比例。AUC和Gini系数的换算关系为:
Gini系数 =2*AUC -1
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
2019-03-13 我的文本生成NLU应用基本就是用的这个git来做的,非常好
2018-03-13 【VGG 迁移学习 tensorflow】今天利用VGG-16做了图片的迁移学习,本来想看相似度的,发现效果还行,要继续优化
2018-03-13 【Linecode】这道题目做了有一会儿 - 图是否是树
2018-03-13 【Lintcode】二叉树的最大深度 - 比较简单,用递归比较好,不递归也能做,比较麻烦
2018-03-13 【Lintcode】删除二叉查找树的节点 - 很好,有一定难度,提交了三次通过的
2017-03-13 今天面试的题目
2017-03-13 用非递归的方式求最低公共祖先