机器学习中的 上采样 下采样 过采样 欠采样
1. 过采样和欠采样
这是两种解决分类训练过程中数据量不平衡的采样方法
拿二分类举例,期望阳性样本数量:阴性样本数量 = 1:1,但实际上阳性样本数量:阴性样本数量 = 1000:100
过采样
将100数据复制10份,达到两个样本数量之比为1000:1000
欠采样
将1000数据随机抽取100份,达到两个样本数量之比为100:100
2. 上采样和下采样
卷积神经网络(CNN)是由卷积层/池化层/激活层……组成的“自上而下”的多层网络,原始图像从CNN顶层输入,到底层生成特征图,这个过程称为下采样
相反的,由一个特征图反推出原图的过程称为上采样