06 2022 档案

摘要:不平衡数据集是指类别分布严重偏斜的数据集,例如少数类与多数类的样本比例为 1:100 或 1:1000。 训练集中的这种偏差会影响许多机器学习算法,甚至导致完全忽略少数类,容易导致模型过拟合,泛化能力差。 所以,针对类别分布不均衡的数据集,一般会采取采样的方式,使得类别分布相对均衡,提升模型泛化能力 阅读全文
posted @ 2022-06-08 16:54 xihuishaw 阅读(3293) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示