准确率、精确率、召回率、F-Measure、ROC、AUC

 先理解一下正类(Positive)和负类(Negetive),比如现在要预测用户是否点击了某个广告链接,点击了才是我们要的结果,这时,点击了则表示为正类,没点击则表示为负类。

  TP(True Positive):被预测成了正类的正类,即正确预测的正类

  FP(False Positive):被预测成了正类的负类

  TN(True Negetive):被预测成了负类的负类,即正确预测的负类

  FN(False Negetive):被预测成了负类的正类

一、准确率(Accuracy)

  准确率跟正类负类没多大关系,表示在预测结果中,正确预测的数量 / 样本总数。

二、精确率(Precision)

  在预测结果中,正确预测的正类数 / 预测为正类的数量 : TP / (TP+FP)

三、召回率(Recall)

  在预测结果中,正确预测的正类数 / 原本即为正类的数量 : TP / (TP+FN)

四、F-Measure

  用precision和recall两个指标不直观,索性把他们合并为一个变量——F-measure:Recall * Precision * 2 / (Recall + Precision)(越大越好,1为理想状态,此时precision为1,recall为1)

五、ROC

  ROC曲线是以 FP Rate 为横轴,TP Rate 为纵轴的曲线。如下图所示

        

 

六、AUC

  AUC 即 ROC 曲线对应的面积,面积越大越好。

 

posted @ 2019-06-21 20:32  大数据的奇妙冒险  阅读(8062)  评论(0编辑  收藏  举报