【DL基础】数据增强方法总结
前言
一、数据增强的作用
1. 避免过拟合;
2. 提升模型鲁棒性,降低模型对图像的敏感度;
3. 增加训练数据,提高模型泛化能力;
4. 避免样本不均衡;
二、数据增强的常用方法
几何变换类(翻转,旋转,裁剪,变形,缩放等)、颜色变化类(噪声、模糊、颜色变换、擦除、填充等);
1. 缩放resize:最近邻插值、双线性插值、双三次插值;
2. 裁剪crop:中心裁剪、四角裁剪、随机裁剪;
3. 翻转flip:水平翻转、垂直翻转、对角线翻转(不常用);
4. 旋转rotate:以不同角度对原图进行旋转,填充;
5. 模糊blur:均值模糊、中值模糊、高斯模糊;调整对比度(直方图均衡化);
6. 色域变换:调整色度(hue)、亮度(luminance)、饱和度(saturation);
7. ChannelShuffle:随机shuffle图像的通道. 例如RGB图像,R通道和B通道的值进行互换;
8. 仿射变换:平移、旋转、缩放、错切(shear);
9. 透视变换perspective:
可以简单把透视变换理解成3D版的仿射变换. 从平面视觉上看,二者的区别是透视变换是不规则的四边形、仿射变换是规则的平行四边形;
10. mixup:对两张图片按比例进行混合,生成的图像的标签根据混合比例进行分配;
11. cutout:随机cut掉N个矩形区域,并使用常数0进行填充. 标签保持不变;
12. cutmix:随机cut掉N个矩形区域,并使用另一张图像的同一位置像素值进行填充,生成的图像的标签根据二者区域占比进行分配;
13. 随机擦除(random erasing):类似Cutout的方法;
与Cutout的区别在于:
a) 擦除区域:Random Erasing每次cut的区域大小随机,Cutout每次cut的区域大小固定;
b) 填充方法:Random Erasing以随机数字进行填充,Cutout以0进行填充;
14. mosaic:将多张(eg. 4/6/9)不同的图像拼接在一起;
15. Copy-paste:对于一张图片A使用Copy-paste数据增强方法,则需要从另外张图片B从随机选取目标子集O,再将O粘贴至A的随意位置. 这里的目标子集O是像素级别的,如图像分割任务中的目标mask;
16. gridmask:主要思想是对Mixup, Cutmix、Cutout等类似方法的改进,由于掩码区域的选择都是随机的,因此容易出现对重要部位全掩盖的情况。而GridMask则最多出现部分掩盖,且几乎一定会出现部分掩盖。使用的方式是排列的正方形区域来进行掩码。
17. 网络中增强:dropout;
18. SMOTE: Synthetic Minority Over-sampling Technique:
19. SamplePairing:
20. GAN:
21. Autoaugmentation:
22. RandAugment:
23. TTA测试时增强:
24. Borderline-SMOTE: A New Over-Sampling Method in Imbalanced Data Sets Learning
25. ADASYN: Adaptive Synthetic Sampling Approach For Imbalanced Learning
26. Oversampling for Imbalanced Learning Based on K-Means and SMOTE
27. SMOTE: Synthetic Data Augmentation for Tabular Data
参考
1. 一览常用的数据增强方法;
2. 数据增强(Data Augmentation)方法介绍;
完
心正意诚,做自己该做的事情,做自己喜欢做的事情,安静做一枚有思想的技术媛。
版权声明,转载请注明出处:https://www.cnblogs.com/happyamyhope/
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】
2021-07-07 【linux基础 】批量处理labelme的json数据
2021-07-07 【软硬件环境安装】openMMLab的软件环境搭建