Data augmentation from torchvision 简单记录
data augmentation
最近在看cnn进行图片分类的网络,跑在food-11数据集上
其中一步就是要对已有的labeled data进行数据强化
使用torchvision的transforms可以实现对图片的转换,记录几个常用的transforms
transforms作为参数传递给创建Dataset的函数中,更具体的说,是作用在get_item()这个函数里
在一个epoch的训练中,是每次一个batch的取数据的。对于一些随机的transforms来说,在一个batch里,transforms产生的变化是唯一的,但是在每一个batch中,造成的效果可以不同
Compose
将多个转化组合在一起
transforms.Compose([
transforms.CenterCrop(10),
transforms.ToTensor(),
])
Resize
将图片的大小设置为指定的尺寸,可以以[H,W]的形式给出来,也可以指定一个整数,则为L*L
效果:
CenterCrop
在图片的中心进行裁剪,与resize同理,可以指定大小
效果:
Grayscale
将图片变为灰度图
效果:
RandomPerspective
将图片进行随机的透视,可以设置失真度(默认0.5)和随机透视的概率(默认50%)
效果:
RandomHorizontalFlip
RandomVerticalFlip与之类似,将图片进行水平或垂直的翻转,需要设置将其变化的概率,默认为0.5
效果: