随笔 - 942,  文章 - 0,  评论 - 37,  阅读 - 54万

简介

实例基本流程:
数据载入->数据可视化与预处理->模型创建->全数据用于模型训练->模型评估

数据分离可以用于模型评估

对全数据进行数据分离,部分用于训练,部分用于新数据的结果预测!

通常来说分为3步:

  1. 把数据分成两部分:训练集、测试集
  2. 使用训练集数据进行模型训练
  3. 使用测试集数据进行预测,更有效地评估模型对于新数据的预测表现

这里的训练集和测试集的比例可以灵活调整, 参考:训练集占70%,测试集占30%;也可能训练集占80%,测试集占20%。

混淆矩阵

在我们前面的分类任务中,都是计算测试数据集预测准确率以评估模型表现,但如果只用accuracy会有很大的局限性,无法真实反映模型针对各个分类的预测准确度

准确率(accuracy):没有体现数据预测的实际分布情况(0,1本身的分布比例), 没有体现模型错误预测的类型

TP: T预测准确,P实际为正样本
TN: T预测准确,N实际为负样本
FP: F预测错误,P实际为负样本
FN: F预测错误,N实际为正样本

可以计算更丰富的模型评估指标

参考链接

https://blog.csdn.net/weixin_46344368/article/details/106845649?spm=1001.2014.3001.5502

posted on   HDU李少帅  阅读(202)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
历史上的今天:
2016-04-25 记录每天 做了什么

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示