深入理解F1-score

本博客的截图均来自zeya的post：Essential Things You Need to Know About F1-Score | by Zeya | Towards Data Science

F1-score的定义：准确率（precision）和召回率（recall）的调和平均（harmonic mean）

这里主要理解一下为什么使用调和平均，从“调和”这个词出发也可以知道，调和平均可以使得recall和precision之间的差距较小，否则F1会很小，这个很小的幅度比几何平均、算数平均来的还要快，以下是三种平均值的定义：

按照zeya的说法，如果我们浏览器搜索为什么F1分数使用调和平均，则会得到类似“调和平均会惩罚不相等的数对惩罚的更厉害”（harmonic mean penalises unequal values more）和“调和平均会惩罚极值”（harmonic mean punishes extreme values），具体理解调和平均相对于另外两种平均的优势可以看下图：

此网址是上图的动态图：Online Graph Maker · Plotly Chart Studio

平面的两个坐标轴是召回率和准确率，紫色的点是调和平均的值，绿色的点是几何平均的值，红色的点是算数平均的值，让我们来看坐下角的值：

从上图我们可以知道，对于相同的（precision=1，recall=0.05）数对，紫色的调和平均给的分数最低，也就是惩罚这种不平均、不平衡或是有极值的（准确率，召回率）数对惩罚的最厉害，从整体上看，紫色的最弯曲，意味着对于相同的（precision，recall）坐标，调和平均的分数不会比其他两种高。

posted @ 2022-02-03 15:35 Hisi 阅读(1693) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

深入理解F1-score

公告