深度学习数据预处理

训练过程中有时会遇到过拟合的问题，其中一个解决方法就是对训练数据做增强，对数据进行处理得到不同的图像，从而泛化数据集。数据增强API是定义在领域目录的transofrms下，这里介绍两种使用方式，一种是基于框架内置数据集，一种是基于自定义的数据集。

一、飞桨框架内置数据集

针对飞桨框架内置图像数据集的预处理，飞桨框架将这部分API整合到paddle.vision.transforms下，你可以通过以下方式查看：

import paddle

print('数据处理方法：', paddle.vision.transforms.__all__)

数据处理方法： ['BaseTransform', 'Compose', 'Resize', 'RandomResizedCrop', 'CenterCrop', 'RandomHorizontalFlip', 'RandomVerticalFlip', 'Transpose', 'Normalize', 'BrightnessTransform', 'SaturationTransform', 'ContrastTransform', 'HueTransform', 'ColorJitter', 'RandomCrop', 'Pad', 'RandomRotation', 'Grayscale', 'ToTensor', 'to_tensor', 'hflip', 'vflip', 'resize', 'pad', 'rotate', 'to_grayscale', 'crop', 'center_crop', 'adjust_brightness', 'adjust_contrast', 'adjust_hue', 'normalize']

可以同构以下方式随机调整图像的亮度、对比度、饱和度，并调整图像的大小，对图像的其他调整，可以参考相关的API文档。

from paddle.vision.transforms import Compose, Resize, ColorJitter

# 定义想要使用的数据增强方式，这里包括随机调整亮度、对比度和饱和度，改变图片大小

transform = Compose([ColorJitter(), Resize(size=32)])

# 通过transform参数传递定义好的数据增强方法即可完成对自带数据集的增强

train_dataset = paddle.vision.datasets.MNIST(mode='train', transform=transform)

二、自定义数据集

对于自定义的数据集，可以在数据集的构造函数中进行数据增强方法的定义，之后对 __getitem__ 中返回的数据进行应用，就可以完成自定义数据增强。

import paddle

from paddle.io import Dataset

from paddle.vision.transforms import Compose, Resize

BATCH_SIZE = 64

BATCH_NUM = 20

IMAGE_SIZE = (28, 28)

CLASS_NUM = 10

class MyDataset(Dataset):

def __init__(self, num_samples):

super(MyDataset, self).__init__()

self.num_samples = num_samples

# 在 `__init__` 中定义数据增强方法，此处为调整图像大小

self.transform = Compose([Resize(size=32)])

def __getitem__(self, index):

data = paddle.uniform(IMAGE_SIZE, dtype='float32')

# 在 `__getitem__` 中对数据集使用数据增强方法

data = self.transform(data.numpy())

label = paddle.randint(0, CLASS_NUM-1, dtype='int64')

return data, label

def __len__(self):

return self.num_samples

# 测试定义的数据集

custom_dataset = MyDataset(BATCH_SIZE * BATCH_NUM)

print('=============custom dataset=============')

for data, label in custom_dataset:

print(data.shape, label.shape)

break

=============custom dataset=============

[32, 32] [1]

可以看出，输出的形状从 [28, 28, 1] 变为了 [32, 32, 1]，证明完成了图像的大小调整。

posted @ 2021-02-11 09:10 吴建明wujianming 阅读(440) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· .NET10 - 预览版1新功能体验（一）

公告

昵称：吴建明wujianming
园龄： 7年5个月
粉丝： 532
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

吴建明

深度学习数据预处理

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论