2018年4月25日

机器学习中样本不均衡的问题

摘要: 在实际中,训练模型用的数据并不是均衡的,在一个多分类问题中,每一类的训练样本并不是一样的,反而是差距很大。比如一类10000,一类500,一类2000等。解决这个问题的做法主要有以下几种: 欠采样:就是把多余的样本去掉,保持这几类样本接近,在进行学习。(可能会导致过拟合) 过采样:就是增加比较少样本 阅读全文

posted @ 2018-04-25 11:34 特立独行的十楼 阅读(1257) 评论(0) 推荐(0) 编辑

导航