常用的评价指标
分类问题
分类问题的标签是离散的,一般是无序且独立的。
分类问题可以细分为:
- 二分类问题
是指数据的标签只有两类,比如图片的猫狗识别,只有猫和狗两类。一般用 正样本(1) 和 负样本(0) 来分别表示这两类。 - 多分类问题
是指数据的标签有多类,比如阿拉伯数字识别,需要根据图片来识别这个数字是 0 至 9 的哪个数字。这是一个 10 分类问题,用 0 至 9 分别表示这 10 个类别。
前面的问题,输出都是某个标签,这些标签是互斥的,比如在猫狗识别的例子中,某图片要么是猫要么是狗。但有的问题的输出不是互斥标签。
- 多标签分类问题
比如一个文档相关的话题. 一个文本可能被同时认为是宗教、政治、金融或者教育相关话题。
ACC准确率:
准确率=
预测的样本数
预测对的样本数
混淆矩阵
其中 T 和 F 分别表示 true
和 false
,表示预测的是否准确。 P 和 N 分别表示 positive
和 negative
,分别表示预测为正样本和负样本。根据混淆矩阵,查准率和查全率的公式定义如下:
Precession
Recall
F1
ROC和AUC
排序问题
MAP
MRR
NDCG
参考资料:
Enlighten AI · 机器学习
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 记一次.NET内存居高不下排查解决与启示