F1 - Score\Precision\Recall The Single number evaluation metric(单一评估标准)

在这里插入图片描述

Precision(%)= $\frac{True \ positive}{number\ of \ predicted \ positive}*100=\frac{True \ positive}{True \ positive + False \ Positive}*100$

Recall(%)= $\frac{True \ positive}{number\ of \ actually \ positive}*100=\frac{True \ positive}{True \ positive + False \ Negative}*100$

当你有多个Classifiers时，每一个Classifier的Precision和Recall可能都不一样，而且Precision和Recall之间是存在取舍关系的。因此以Precision和Recall作为衡量指标是不太可行的，你无法一眼看出哪个Classifier表现得更好。

直观而言，你会想到以 $(P r e c i s i o n + R e c a l l) / 2$ 作为一个单一的度量指标，但直接求平均数并不太科学，我们有更好的求平均的方法F1 Score，称作调和平均(Harmonic)。

$F_1Score=\frac{2}{\frac{1}{P}+\frac{1}{R}}$

你可以简单理解F1 Score为P和R的“平均”。

百度百科里有全面的解释：
在这里插入图片描述

使用Dev Set和单一的评估标准能够加速你学习的迭代过程。

posted @ 2018-12-10 20:51 从流域到海域阅读(67) 评论(0) 编辑收藏举报

刷新页面返回顶部

从流域到海域