随笔 - 942, 文章 - 0, 评论 - 37, 阅读 - 54万

机器学习之数据分离与混淆矩阵

简介

实例基本流程：
数据载入->数据可视化与预处理->模型创建->全数据用于模型训练->模型评估

数据分离可以用于模型评估

对全数据进行数据分离，部分用于训练，部分用于新数据的结果预测！

通常来说分为3步：

把数据分成两部分：训练集、测试集
使用训练集数据进行模型训练
使用测试集数据进行预测，更有效地评估模型对于新数据的预测表现

这里的训练集和测试集的比例可以灵活调整，参考：训练集占70%，测试集占30%；也可能训练集占80%，测试集占20%。

混淆矩阵

在我们前面的分类任务中，都是计算测试数据集预测准确率以评估模型表现，但如果只用accuracy会有很大的局限性，无法真实反映模型针对各个分类的预测准确度

准确率（accuracy）：没有体现数据预测的实际分布情况（0,1本身的分布比例），没有体现模型错误预测的类型

TP： T预测准确，P实际为正样本
TN： T预测准确，N实际为负样本
FP： F预测错误，P实际为负样本
FN： F预测错误，N实际为正样本

可以计算更丰富的模型评估指标

参考链接

https://blog.csdn.net/weixin_46344368/article/details/106845649?spm=1001.2014.3001.5502

posted on 2022-04-25 11:23 HDU李少帅阅读(202) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 实战（二）机器学习之数据分离与混淆矩阵

· 使用机器学习对曲线进行线性回归

· 混淆矩阵简介

· 混淆矩阵(Confusion Matrix)

· 机器学习系列3 机器学习的流程

阅读排行：
· 无需6万激活码！GitHub神秘组织3小时极速复刻Manus，手把手教你使用OpenManus搭建本
· Manus爆火，是硬核还是营销？
· 终于写完轮子一部分：tcp代理了，记录一下
· 别再用vector＜bool＞了！Google高级工程师：这可能是STL最大的设计失误
· 单元测试从入门到精通

历史上的今天：
2016-04-25 记录每天做了什么

昵称： HDU李少帅
园龄： 10年8个月
粉丝： 34
关注： 28

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:线段树学习
@南风-- 太菜了... 求带飞...
--HDU李少帅
2. Re:线段树学习
都快10年了，还搁这线段树呢，哥们你是开始教io了吗？
--南风--
3. Re:node js 版本更新
吊毛杰哥，咋开始学前端了。为啥不用nvm管理
--lllliii
4. Re:文献阅读 A Subdivision Scheme for Hexahedral Meshes
你好，我最近也在复现这篇论文，但是得不出同样的结果，对于新点的计算请问方便讲得再详细一点吗，多有打扰
--xylor
5. Re:WINGDIAPI error
亲测有效
--poseidon_c