样本不均衡问题
1.过采样,多次训练小数量的类别或者把小类别造数据,比如一些数据增强的方式
2.降采样,多的类别只选部分来寻来呢
3.每个batch里面类别尽量均衡
4.在loss里面加权重
5.ohem,因为可能类别比较多,训练网络久了,也许loss就小了
6.分治ensemble
将大类中样本聚类到L个聚类中,然后训练L个分类器;每个分类器使用大类中的一个簇与所有的小类样本进行训练得到;最后对这L个分类器采取少数服从多数对未知类别数据进行分类,如果是连续值(预测),那么采用平均值。
https://blog.csdn.net/songhk0209/article/details/71484469
https://blog.csdn.net/qq_14845119/article/details/78930091