样本不均衡问题

1.过采样，多次训练小数量的类别或者把小类别造数据，比如一些数据增强的方式

2.降采样，多的类别只选部分来寻来呢

3.每个batch里面类别尽量均衡

4.在loss里面加权重

5.ohem，因为可能类别比较多，训练网络久了，也许loss就小了

6.分治ensemble
将大类中样本聚类到L个聚类中，然后训练L个分类器；每个分类器使用大类中的一个簇与所有的小类样本进行训练得到；最后对这L个分类器采取少数服从多数对未知类别数据进行分类，如果是连续值（预测），那么采用平均值。

https://blog.csdn.net/songhk0209/article/details/71484469

https://blog.csdn.net/qq_14845119/article/details/78930091

posted @ 2018-08-23 22:36 有梦就要去实现他阅读(195) 评论(0) 编辑收藏举报

刷新页面返回顶部