什么是图像增广(Image Data Augmentation)
1、定义:
广义的图像数据增强:以增加数据的多样性;有时指的是图像质量增强,如超分辨率技术。
广义的图像数据增强包含图像质量增强技术
2、作用:
深度学习以数据驱动方式训练模型,因此深度学习是数据依赖的。
在深度学习中,图像增强是提高模型准确率的有效途径之一,很多情况下,加入适合的图像增广后。深度学习的模型准确率能够提升2%-5%以上,甚至更多。
图像增广方法分类
1、图像变换:
1)颜色变换、色调分离、对比度、饱和度
2)几何变换
① 旋转 ② 剪裁 ③ 平移 ④ 翻转 ⑤ 缩放 ⑥ 仿射变换
2、图像合成:
1)简单合成
① Mixup ② Cutmix ③ AugMix
2)自动生成
① GAN ② 对抗学习
图像变换技术
1、几何变换:
1)图像平移 Translate
2)图像旋转 Rotate
3)图像裁剪 Crop
4)图像缩放 Resize/Scale
5)图像翻转 Flip
6)错切 Shear
7)仿射变换 Affine
2、颜色变换:
1)色调分离 Posterize 从原渐变色到跳阶色
2)图像的锐度、亮度、饱和度、对比调整
RandAugment 无监督图像增广
主要思想:
对每幅图像,从14种图像变换方法中,随机选择N种图像变换方法,并进行M种不同强度的扭曲形变。
该方法避免了AutoAugment方法在参数空间中的较大搜索代价;无需在下游任务上搜索验证。
Mixup 图像合成方法 监督型图像增广
1、主要思想:
两幅图像的对应像素值及标签向量线性加权相加
2、简述
x是像素点,y是标签
合成图像的对应标签:对原始
由随机生成的数λi、λj,对两幅原始图像的标签向量yi和yj(one-hot编码向量),进行线性加权求和,得到合成图像的对应标签。
y = λi * yi + λj * ij,
Manifold Mixup 图像合成方法 监督型图像增强
1、主要思想:两幅图像的特征向量
2、简述:
CutMix 图像合成方法 监督型图像增强
1、主要思想:将一幅图像的部分区域(图像块)进行替换,并更新其标签向量
2、简述:
λ是根据两幅图在合成后的图像中的占比决定,如cat图像在合成后的图像中占比为0.9,故λcat = 0.9
AugMix 图像合成方法
1、主要思想:将同一幅图像同时进行K次不同的混合图像变换,再加权合成不同混合变换的图像。(不对标签进行操作)
2、简述:
3、特点:将所有图像(K幅)对应像素值像素都进行线性插值,进行合成,最后利用Beta分布生成权重与原图合成.
误差回传,权值更新
其它图像增广方法
知识产权声明: 本博文中的ppt素材及相关内容和知识产权,均属于河南大学张重生老师所讲授的《深度学习》课程及张重生老师在2025年出版的著作《新一代人工智能 从深度学习到大模型》(机械工业出版社)。特此声明。
真挚地感谢张重生老师在本人于河南大学学习期间的教导。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律