torchvision简介
安装pytorch时,torchvision独立于torch。torchvision包由流行的数据集(torchvision.datasets)、模型架构(torchvision.models)和用于计算机视觉的常见图像转换组成t(torchvision.transforms)。
1)数据库
- MNIST
- Fashion-MNIST
- KMNIST
- EMNIST
- COCO
- LSUN
- ImageFolder
- DatasetFolder
- Imagenet-12
- CIFAR
- STL10
- SVHN
- PhotoTour
- SBU
- Flickr
- VOC
- Cityscapes
使用torchvision.datasets中的数据集
import torchvision mnist = torchvision.datasets.MNIST("path/to/mnist/", train=True, transform=transforms, target_transform=None, download=False)
2)模型框架
使用torchvision.models中的模型
import torchvision vgg16 = torchvision.models.vgg16(pretrained=True)
3)变换操作
- Transforms on PIL Image
- Transforms on torch.*Tensor
- Conversion Transforms
- Generic Transforms
- Functional Transforms
Transforms on PIL Image中常用的有操作:
torchvision.transforms.CenterCrop(size) torchvision.transforms.RandomCrop(size, padding=None, pad_if_needed=False, fill=0, padding_mode='constant') torchvision.transforms.RandomHorizontalFlip(p=0.5) torchvision.transforms.RandomRotation(degrees, resample=False, expand=False, center=None) torchvision.transforms.Resize(size, interpolation=2) torchvision.transforms.Scale(*args, **kwargs) #还有更多再次不列出,详见
略
使用torchvision.transforms中的变换
transfrom = torchvision.transforms.CenterCrop(224)
手与大脑的距离决定了理想与现实的相似度