深入理解F1-score
本博客的截图均来自zeya的post:Essential Things You Need to Know About F1-Score | by Zeya | Towards Data Science
F1-score的定义:准确率(precision)和召回率(recall)的调和平均(harmonic mean)
这里主要理解一下为什么使用调和平均,从“调和”这个词出发也可以知道,调和平均可以使得recall和precision之间的差距较小,否则F1会很小,这个很小的幅度比几何平均、算数平均来的还要快,以下是三种平均值的定义:
按照zeya的说法,如果我们浏览器搜索为什么F1分数使用调和平均,则会得到类似“调和平均会惩罚不相等的 数对 惩罚的更厉害”(harmonic mean penalises unequal values more)和“调和平均会惩罚极值”(harmonic mean punishes extreme values),具体理解调和平均相对于另外两种平均的优势可以看下图:
此网址是上图的动态图:Online Graph Maker · Plotly Chart Studio
平面的两个坐标轴是召回率和准确率,紫色的点是调和平均的值,绿色的点是几何平均的值,红色的点是算数平均的值,让我们来看坐下角的值:
从上图我们可以知道,对于相同的(precision=1,recall=0.05)数对,紫色的调和平均给的分数最低,也就是惩罚这种不平均、不平衡或是有极值的(准确率,召回率)数对惩罚的最厉害,从整体上看,紫色的最弯曲,意味着对于相同的(precision,recall)坐标,调和平均的分数不会比其他两种高。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
· 25岁的心里话