【DL基础】数据增强方法总结

前言

 

一、数据增强的作用

1. 避免过拟合;

2. 提升模型鲁棒性,降低模型对图像的敏感度;

3. 增加训练数据,提高模型泛化能力;

4. 避免样本不均衡;

二、数据增强的常用方法

几何变换类(翻转,旋转,裁剪,变形,缩放等)、颜色变化类(噪声、模糊、颜色变换、擦除、填充等);

1. 缩放resize:最近邻插值、双线性插值、双三次插值;

2. 裁剪crop:中心裁剪、四角裁剪、随机裁剪;

3. 翻转flip:水平翻转、垂直翻转、对角线翻转(不常用);

4. 旋转rotate:以不同角度对原图进行旋转,填充;

5. 模糊blur:均值模糊、中值模糊、高斯模糊;调整对比度(直方图均衡化);

6. 色域变换:调整色度(hue)、亮度(luminance)、饱和度(saturation);

7. ChannelShuffle:随机shuffle图像的通道. 例如RGB图像,R通道和B通道的值进行互换;

8. 仿射变换:平移、旋转、缩放、错切(shear);

9. 透视变换perspective: 

可以简单把透视变换理解成3D版的仿射变换. 从平面视觉上看,二者的区别是透视变换是不规则的四边形、仿射变换是规则的平行四边形;

10. mixup:对两张图片按比例进行混合,生成的图像的标签根据混合比例进行分配;

11. cutout:随机cut掉N个矩形区域,并使用常数0进行填充. 标签保持不变;

12. cutmix:随机cut掉N个矩形区域,并使用另一张图像的同一位置像素值进行填充,生成的图像的标签根据二者区域占比进行分配;

13. 随机擦除(random erasing):类似Cutout的方法;

与Cutout的区别在于:

a) 擦除区域:Random Erasing每次cut的区域大小随机,Cutout每次cut的区域大小固定;

b) 填充方法:Random Erasing以随机数字进行填充,Cutout以0进行填充;

14. mosaic:将多张(eg. 4/6/9)不同的图像拼接在一起;

15. Copy-paste:对于一张图片A使用Copy-paste数据增强方法,则需要从另外张图片B从随机选取目标子集O,再将O粘贴至A的随意位置. 这里的目标子集O是像素级别的,如图像分割任务中的目标mask;

16. gridmask:主要思想是对Mixup, Cutmix、Cutout等类似方法的改进,由于掩码区域的选择都是随机的,因此容易出现对重要部位全掩盖的情况。而GridMask则最多出现部分掩盖,且几乎一定会出现部分掩盖。使用的方式是排列的正方形区域来进行掩码。

17. 网络中增强:dropout;

18. SMOTE: Synthetic Minority Over-sampling Technique

19. SamplePairing:

20. GAN:

21. Autoaugmentation:

22. RandAugment:

23. TTA测试时增强

24. Borderline-SMOTE: A New Over-Sampling Method in Imbalanced Data Sets Learning

25. ADASYN: Adaptive Synthetic Sampling Approach For Imbalanced Learning

26. Oversampling for Imbalanced Learning Based on K-Means and SMOTE

27. SMOTE: Synthetic Data Augmentation for Tabular Data

参考

1. 一览常用的数据增强方法

2. 数据增强(Data Augmentation)方法介绍

posted on 2022-07-07 18:21  鹅要长大  阅读(286)  评论(0编辑  收藏  举报

导航