【sklearn】性能度量指标之ROC曲线(二分类)

原创博文,转载请注明出处!

1.ROC曲线介绍

  • ROC曲线适用场景
    • 二分类任务中,positive和negtive同样重要时,适合用ROC曲线评价
  • ROC曲线的意义
    • TPR的增长是以FPR的增长为代价

2.ROC曲线绘制

  • 纵坐标为TPR
    • TPR(True Positive Rate)真正确率,即模型正确识别正例的比例,TPR=TP/(TP+FN)
  • 横坐标为FPR
    • FPR(False Positive Rate)假正确率,即模型错误将反例识别为正例的比例,FPR=FP/(FP+TN)
  • ROC曲线的绘制过程
    • 给定m个正例和n个反例。首先,根据学习器预测结果对样本排序;然后,先把所有样本均预测为反例,再一次将每个样本划分为正例(阈值从大到小的过程)。

3.sklearn中roc曲线

  1 from sklearn.metrics import roc_curve
  2 tpr,fpr,thresholds = roc_curve(y_test,y_pred)
  3 
  4 import matplotlib.pyplot as plt
  5 plt.plot(fpr, tpr)
  6 plt.xlim([0.0, 1.0])
  7 plt.ylim([0.0, 1.0])
  8 plt.title('ROC curve for diabetes classifier')
  9 plt.xlabel('False Positive Rate (1 - Specificity)')
 10 plt.ylabel('True Positive Rate (Sensitivity)')
 11 plt.grid(True)
posted @ 2018-03-25 10:54  wanglei5205  阅读(3266)  评论(0编辑  收藏  举报
levels of contents