摘要: 在机器学习中我们经常会遇到一个比较让人头疼的问题,就是样本类别比例失衡,在我第一次参加的Kaggle的比赛中,是一个而分类问题,给定的训练集样本中正负样本的比例大致达到惊人的1:1600。 通过网上搜集资料,其实针对这样的情况解决办法可以分为三种: 第一种: 将正向样本进行重复混入训练样本中 因为训 阅读全文
posted @ 2018-04-18 23:01 在路上-UP 阅读(2200) 评论(0) 推荐(0) 编辑