数据集特点

1.训练集各类样本比例不均(样本不平衡)

方法:

1.过采样:

  缺点:错误(噪声)样本可能造成较大影响

2.欠采样:

  缺点:丢样本 损失较大

3.扩大数据集:

  a.抽取部分样本,求平均

  b.随机噪声

(2.如果训练集样本与测试集样本本身有巨大的gap,训练的过程总是让人煎熬)

 

  

posted @ 2019-05-27 19:37  youqia  阅读(810)  评论(0编辑  收藏  举报