[pytorch]数据集增强方法
数据增强的库
pytorch自带
imgaug
https://github.com/aleju/imgaug
数据增强(旋转、翻转、加噪声、加对比度、亮度)
(更多操作,也可以加天气效果,推荐)
它可以实现的效果包括添加噪音、仿射变换、裁剪、翻转、旋转等,其效果图如下所示:
Augmentor
简单操作
Albumentations
是 2018年的一篇论文《Albumentations: fast and flexible image augmentations》的实现代码
数据增强(添加下雨 下雪 雾效果)
速度比大部分的库都要快;基于 numpy 和 OpenCV 两个库,并选择最合适的一个接口简单,灵活大量的多种的变换方法实现易于拓展应用到其他的任务或者库支持的变换操作对象有图像、masks、关键点、边界框支持 python 3.5-3.7 的版本可以和 PyTorch 结合使用已经被应用到很多深度学习的竞赛中,包括 Kaggle、topcoder,CVPR,MICCAI作者是 Kaggle Masters
ImageEnhance
适用于opencv-python、PIL
同样来自一篇论文《Biomedical image augmentation using Augmentor》
区分:
imgaug:操作更多(但相对opencv-python,代码简洁),支持keypoint, bounding box同步处理 ******
Albumentations: 据说可以进行 加雨雪雾的效果
Augmentor:操作较少(但相对opencv-python,代码简介)
ImageEnhance: 4种操作颜色增强
1、对比度:白色画面(最亮时)下的亮度除以黑色画面(最暗时)下的亮度;
2、色彩饱和度::彩度除以明度,指色彩的鲜艳程度,也称色彩的纯度;
3、色调:向负方向调节会显现红色,正方向调节则增加黄色。适合对肤色对象进行微调;
4、锐度:是反映图像平面清晰度和图像边缘锐利程度的一个指标。
opencv-python:
1、随机裁剪、旋转、翻转;
2、随机颜色、明暗;
3、仿射变换;
数据增强的例子
数据增强的论文
Mixup
来自 ICLR 2018 的论文:《Mixup: BEYOND EMPIRICAL RISK MINIMIZATION》
Cutout
2017年的论文:《Improved Regularization of Convolutional Neural Networks with Cutout》
Cutmix
ICCV 2019 的论文:《CutMix:Regularization Strategy to Train Strong Classifiers with Localizable Features》
Augmix
ICLR 2020 的论文:《AUGMIX: A SIMPLE DATA PROCESSING METHOD TO IMPROVE ROBUSTNESS AND UNCERTAINTY》
fast-autoaugment
NeurlIPS 2019 的论文《 Fast AutoAugment》
AutoAugment
CVPR 2019 的论文 《AutoAugment:Learning Augmentation Strategies from Data》
RandAugment
ICLR 2020 的论文《RandAugment: Practical automated data augmentation with a reduced search space》
GridMask
2020年的论文题目《GridMask Data Augmentation》
imagecorruptions
2019 年的论文《Benchmarking Robustness in Object Detection:Autonomous Driving when Winter is Coming》
CycleGAN
ICCV 2017 年的一篇论文《Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networkss》,也是 GAN 领域非常有名的一篇论文
Small Object Augmentation
2019 年的论文《Augmentation for small object detection》