深入理解F1-score

本博客的截图均来自zeya的post:Essential Things You Need to Know About F1-Score | by Zeya | Towards Data Science

 

F1-score的定义:准确率(precision)和召回率(recall)的调和平均(harmonic mean)

 

 

 

  这里主要理解一下为什么使用调和平均,从“调和”这个词出发也可以知道,调和平均可以使得recall和precision之间的差距较小,否则F1会很小,这个很小的幅度比几何平均、算数平均来的还要快,以下是三种平均值的定义:

 

 

 按照zeya的说法,如果我们浏览器搜索为什么F1分数使用调和平均,则会得到类似“调和平均会惩罚不相等的 数对 惩罚的更厉害”(harmonic mean penalises unequal values more)和“调和平均会惩罚极值”(harmonic mean punishes extreme values),具体理解调和平均相对于另外两种平均的优势可以看下图:

 

此网址是上图的动态图:Online Graph Maker · Plotly Chart Studio

平面的两个坐标轴是召回率和准确率,紫色的点是调和平均的值,绿色的点是几何平均的值,红色的点是算数平均的值,让我们来看坐下角的值:

 

 

 

 

 

 

从上图我们可以知道,对于相同的(precision=1,recall=0.05)数对,紫色的调和平均给的分数最低,也就是惩罚这种不平均、不平衡或是有极值的(准确率,召回率)数对惩罚的最厉害,从整体上看,紫色的最弯曲,意味着对于相同的(precision,recall)坐标,调和平均的分数不会比其他两种高。

 

posted @ 2022-02-03 15:35  Hisi  阅读(1693)  评论(0编辑  收藏  举报