图像增强工具 albumentations学习总结

图像增强工具 albumentations学习总结

CONTENT

data augmentations link description
CenterCrop 查看结果 中心剪裁
Crop 查看结果 指定位置剪裁
CropNonEmptyMaskIfExists 查看结果 如果掩码为非空,则使用掩码裁剪区域,否则随机裁剪。
ElasticTransform 查看结果 Best Practices for Convolutional Neural Networks applied to Visual Document
Flip 查看结果 水平,垂直或水平和垂直翻转
GridDistortion 查看结果 albumentations 中主要提供了三种非刚体变换方法:ElasticTransform、GridDistortion 和 OpticalDistortion。
GridDropout 查看结果 以网格方式删除图像的矩形区域
HorizontalFlip 查看结果 水平翻转
IAAAffine 查看结果 在输入上放置规则的点网格,并通过仿射变换在这些点的附近随机移动
IAACropAndPad 查看结果 剪裁和填充
IAAFliplr 查看结果 左右翻转
IAAFlipud 查看结果 上下翻转
IAAPerspective 查看结果 对输入执行随机四点透视变换
IAAPiecewiseAffine 查看结果 在输入端放置一个规则的点网格,并通过仿射变换随机移动这些点的邻域
Lambda 查看结果 用户自定义图像增强
LongestMaxSize 查看结果 如果图像最长边小于max_size, 将最长变为max_size, 并保留长宽比resize
MaskDropout 查看结果
OpticalDistortion 查看结果 畸变
PadIfNeeded 查看结果 判断填充
RandomCrop 查看结果 随机剪裁
RandomCropNearBBox 查看结果
RandomGridShuffle 查看结果 网格打乱图像
RandomResizedCrop 查看结果 剪裁并resize
RandomRotate90 查看结果 随机旋转90度
RandomScale 查看结果 随机尺度变换
RandomSizedBBoxSafeCrop 查看结果
RandomSizedCrop 查看结果 随机剪裁
Resize 查看结果 重新调整图像大小
Rotate 查看结果 旋转
ShiftScaleRotate 查看结果 平移、尺度加旋转变换
SmallestMaxSize 查看结果 将短边变为maxsize, 并保持长宽比
Transpose 查看结果 转置
VerticalFlip 查看结果 垂直翻转

工具函数

原图

1. CenterCrop

回到顶部

2. Crop

回到顶部

3. CropNonEmptyMaskIfExists

回到顶部

4. ElasticTransform

  • alpha、sigma:高斯过滤参数,float类型
  • alpha_affine:范围为 (-alpha_affine, alpha_affine),float 类型
  • interpolation、border_mode、value、mask_value:与其他类含义一样
  • approximate:是否应平滑具有固定大小核的替换映射(displacement map),若启用此选项,在大图上会有两倍的速度提升,boolean类型。
  • p:使用此转换的概率,默认值为 0.5

(1) 首先需要对图像中的每个像素点(x,y)产生两个-1~1之间的随机数,Δx(x,y)和Δy(x,y),分别表示该像素点的x方向和y方向的移动距离;
(2) 生成一个以0为均值,以σ为标准差的高斯核k_nn,并用前面的随机数与之做卷积,并将结果作用于原图像
一般来说,alpha越小,sigma越大,产生的偏差越小,和原图越接近。
参考链接

回到顶部

5. Flip

回到顶部

6. GridDistortion

  • num_steps:在每一条边上网格单元的数量,默认值为 5,int 类型
  • distort_limit:如果是单值,那么会被转成 (-distort_limit, distort_limit),默认值为 (-0.03, 0.03),float或float数组类型
  • interpolation、border_mode、value、mask_value:与其他类含义一样
  • p:使用此转换的概率,默认值为 0.5

回到顶部

7. GridDropout

回到顶部

8. HorizontalFlip

回到顶部

9. IAAAffine

回到顶部

10. IAACropAndPad

回到顶部

11. IAAFliplr

回到顶部

12. IAAFlipud

回到顶部

13. IAAPerspective

回到顶部

14. IAAPiecewiseAffine

回到顶部

15. Lambda

回到顶部

16. LongestMaxSize

回到顶部

17. MaskDropout

回到顶部

18. OpticalDistortion

回到顶部

19. PadIfNeeded

回到顶部

20. RandomCrop

回到顶部

21. RandomCropNearBBox

回到顶部

22. RandomGridShuffle

回到顶部

23. RandomResizedCrop

回到顶部

24. RandomRotate90

回到顶部

25. RandomScale

回到顶部

26. RandomSizedBBoxSafeCrop

回到顶部

27. RandomSizedCrop

回到顶部

28. Resize

回到顶部

29. Resize

回到顶部

30. Rotate

回到顶部

31. ShiftScaleRotate

回到顶部

32. SmallestMaxSize

回到顶部

33. Transpose

回到顶部

34. VerticalFlip

回到顶部

posted @   hou永胜  阅读(12602)  评论(0编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
点击右上角即可分享
微信分享提示