Fork me on GitHub
摘要: 类别不平衡 就是指分类任务中不同类别的训练样例数目差别很大的情况 常用的做法有三种,分别是1.欠采样, 2.过采样, 3.阈值移动 由于这几天做的project的target为正值的概率不到4%,且数据量足够大,所以我采用了欠采样: 欠采样 ,即去除一些反例使得正、反例数目接近,然后再进行学习,基本 阅读全文
posted @ 2018-05-22 20:35 Byron_NG 阅读(21615) 评论(0) 推荐(2) 编辑