几何变换
flip:水平翻转,也叫镜像;垂直翻转
rotation:图片旋转一定的角度,这个可以通过opencv来操作,各个框架也有自己的算子
crop:随机裁剪,比如说,在ImageNet中可以将输入图片进行裁剪,然后输入。
颜色变换
hue:灰度调节,
contrast:在图像的HSV颜色空间,改变H,S和V亮度分量,增加光照变化。对光照有特殊要求的可以使用
saturation:图像饱和度
exposure:增加曝光
多个区域置零
random erase:随机擦除,将图片中的某个区域置零
CutOut:和random erase 差不多,都是将图片中某个区域擦除
hide-and-seek:将图片分为k*k的网格,每个网格已一定概率的方式擦除,和random erase、CutOut差不多
https://blog.csdn.net/weixin_41560402/article/details/106037701
grid mask:首先准备一个mask,mask非零即一,将mask和图片相乘,这样就会擦除很多区域了
https://zhuanlan.zhihu.com/p/103992528
多张图片增强
MixUp:两张图片,经过对应位置,经过线性插值,组成一张新的照片
https://www.jianshu.com/p/d22fcd86f36d
原谅我菜,数学原理看不透
CutMix:就是将一部分区域cut掉但不填充0像素而是随机填充训练集中的其他数据的区域像素值,分类结果按一定的比例分配
https://blog.csdn.net/u013066730/article/details/106354846?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param
Mosica:将4张图像拼成一张图
style transfor GAN也用于数据增强