【sklearn】性能度量指标之ROC曲线(二分类)
原创博文,转载请注明出处!
1.ROC曲线介绍
- ROC曲线适用场景
- 二分类任务中,positive和negtive同样重要时,适合用ROC曲线评价
- ROC曲线的意义
- TPR的增长是以FPR的增长为代价
2.ROC曲线绘制
- 纵坐标为TPR
- TPR(True Positive Rate)真正确率,即模型正确识别正例的比例,TPR=TP/(TP+FN)
- 横坐标为FPR
- FPR(False Positive Rate)假正确率,即模型错误将反例识别为正例的比例,FPR=FP/(FP+TN)
- ROC曲线的绘制过程
- 给定m个正例和n个反例。首先,根据学习器预测结果对样本排序;然后,先把所有样本均预测为反例,再一次将每个样本划分为正例(阈值从大到小的过程)。
3.sklearn中roc曲线
1 from sklearn.metrics import roc_curve 2 tpr,fpr,thresholds = roc_curve(y_test,y_pred) 3 4 import matplotlib.pyplot as plt 5 plt.plot(fpr, tpr) 6 plt.xlim([0.0, 1.0]) 7 plt.ylim([0.0, 1.0]) 8 plt.title('ROC curve for diabetes classifier') 9 plt.xlabel('False Positive Rate (1 - Specificity)') 10 plt.ylabel('True Positive Rate (Sensitivity)') 11 plt.grid(True)