PyTorch 1.0 中文文档：torchvision.datasets

译者：BXuan694

所有的数据集都是torch.utils.data.Dataset的子类，即：它们实现了__getitem__和__len__方法。因此，它们都可以传递给torch.utils.data.DataLoader，进而通过torch.multiprocessing实现批数据的并行化加载。例如：

imagenet_data = torchvision.datasets.ImageFolder('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
                                          batch_size=4,
                                          shuffle=True,
                                          num_workers=args.nThreads)

目前为止，收录的数据集包括：

数据集

MNIST
Fashion-MNIST
EMNIST
COCO
- Captions
- Detection
LSUN
ImageFolder
DatasetFolder
Imagenet-12
CIFAR
STL10
SVHN
PhotoTour
SBU
Flickr
VOC

以上数据集的接口基本上很相近。它们至少包括两个公共的参数transform和target_transform，以便分别对输入和和目标做变换。

阅读全文／改进本文

posted @ 2023-01-17 01:19 绝不原创的飞龙阅读(78) 评论(0) 收藏举报来源

刷新页面返回顶部

龙哥盟

掠夺·扩张·投机·博弈

PyTorch 1.0 中文文档：torchvision.datasets

公告