平均精度(Average Precisio)、阈值(Threshold)、精确率(Precision)、召回率(Recall)
- 平均精度(Average Precisio):简单说就是衡量模型在不同召回率水平下的精确率的平均值。可以理解为模型对预测结果的整体准确性和可靠性的一个综合评估指标。比如说有个选水果的任务,AP就是看在选各种水果(不同召回率情况)时,选对的比例(精确率)的平均情况。如果AP越高,说明模型在判断哪些水果该选、哪些不该选这件事上,整体表现越好。
- 阈值(Threshold):这是一个分界线。在做判断的时候,比如判断一个东西是不是苹果,模型会算出一个分数,当这个分数大于阈值的时候,就认为它是苹果,小于阈值就认为不是。这里阈值设为0.5,就是以0.5这个分数为界限来做判断。
- 精确率(Precision):就是模型预测为正例(比如预测这个水果是苹果)中,真正是正例(实际上它真的是苹果)的比例。在我们的例子里,P = 99.9%,就意味着模型预测是苹果的那些水果里,几乎(99.9%)都是真的苹果。比如说模型判断了1000个水果是苹果,其中999个真的是苹果,那精确率就是99.9%。
- 召回率(Recall):真正的正例(实际上是苹果的水果)中,被模型预测为正例(被模型判断为苹果)的比例。这里R = 93.8%,就是说在所有实际上是苹果的水果里,模型能把其中93.8%的苹果都找出来并判断对。比如总共有1000个真苹果,模型能找出938个并判断它们是苹果。
举例:
假设你有1000张图片,里面有500张是猫的图片(这就是真正的正例),500张不是猫的图片(负例)。 现在用一个图像识别模型来判断这些图片是不是猫,阈值设为0.5。
模型跑完后,预测有499张图片是猫(预测为正例),其中498张真的是猫(真正例),那精确率P = 498 / 499 ≈ 99.8%(和例子中的99.9%类似概念)。
而实际上500张猫的图片中,模型找出了469张(真正例中被正确预测的),那么召回率R = 469 / 500 = 93.8%(和例子中一样)。
平均精度AP就是综合考虑不同召回率情况下精确率的平均值,这里AP = 90.9,说明这个模型在判断图片是不是猫这件事上,整体的准确性和可靠性处于一个较高水平,但还有提升空间(因为AP不是100)。
本文来自博客园,作者:他还在坚持嘛,转载请注明原文链接:他还在坚持嘛 https://www.cnblogs.com/brf-test/p/18639451
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
2020-12-29 Linux---权限相关