爽歪歪666
不以物喜,不以己悲,努力才是永恒的主题。
随笔 - 149,  文章 - 0,  评论 - 6,  阅读 - 13万

1.将图片的路径和标签写入csv文件并实现读取

复制代码
 1  # 创建一个文件,包含image,存放方式:label pokemeon\\mew\\0001.jpg,0
 2     def load_csv(self,filename):
 3         if not os.path.exists(os.path.join(self.root,filename)):
 4             images = [] # 将所有的信息组成一个列表,类别信息通过中间的一个路径判断
 5             for name in self.name2label.keys():
 6                 # pokemeon\\mew\\0001.jpg mew可以通过字典查看其类别
 7                 images += glob.glob(os.path.join(self.root,name,'*.png'))#img的完整路径
 8                 images += glob.glob(os.path.join(self.root,name,'*.jpg'))
 9             random.shuffle(images)
10             with open(os.path.join(self.root,filename),'w') as f:
11                 writer = csv.writer(f)
12                 for img in images:
13                     name = img.split(os.sep)
14                     label = self.name2label[name[-2]]
15                     writer.writerow([img,label])
16 
17          # 从csv中读取文件
18         images, labels = [], []
19         with open(os.path.join(self.root,filename),'r') as f:
20             reader = csv.reader(f)
21             for row in reader:
22                 img,label = row
23                 label = int(label)
24                 images.append(img)
25                 labels.append(label)
26         assert len(images) == len(labels) # 保证数据长度一致
       return images,labels
复制代码

 2.加载自定义数据集

复制代码
  1 """
  2 自定义数据集
  3 image_resize
  4 data argumentation(数据增强):Rotate,crop
  5 normalize:mean,std
  6 ToTensor
  7 
  8 """
  9 import torch
 10 import os,glob
 11 import random,csv
 12 from torch.utils.data import Dataset,DataLoader
 13 from torchvision import transforms
 14 from PIL import Image
 15 import visdom
 16 
 17 
 18 class Pokemon(Dataset):
 19     def __init__(self,root,resize,mode):
 20         super(Pokemon,self).__init__()
 21         self.root = root
 22         self.resize = resize
 23         self.name2label = {}
 24         for name in os.listdir(os.path.join(root)): #把文件和dir都会加载近来
 25             if not sorted(os.path.isdir(os.path.join(root,name))):#排序后,文件夹顺序固定了
 26                 continue
 27             self.name2label[name] = len(self.name2label.keys())
 28         # name2label:{文件夹名,类别编号}
 29         # 创建一个文件,包含image,存放方式:label pokemeon\\mew\\0001.jpg,0
 30         self.images, self.labels = self.load_csv('images.csv')
 31         # 对数据进行裁剪,mode:train-0.6,validation-0.2,test-0.2数据量是不同的
 32         if mode == 'train':
 33             self.images = self.images[:,int(len(self.images)*0.6)]
 34             self.labels = self.labels[:,int(len(self.images)*0.6)]
 35         elif mode == 'val':
 36             self.images = self.images[int(len(self.images)*0.6):int(len(self.images)*0.8)]
 37             self.labels = self.labels[int(len(self.labels)*0.6):int(len(self.labels)*0.8)]
 38         else:
 39             self.images = self.images[int(len(self.images) * 0.8):]
 40             self.labels = self.labels[int(len(self.labels) * 0.8):]
 41 
 42     def load_csv(self,filename):
 43         if not os.path.exists(os.path.join(self.root,filename)):
 44             images = [] # 将所有的信息组成一个列表,类别信息通过中间的一个路径判断
 45             for name in self.name2label.keys():
 46                 # pokemeon\\mew\\0001.jpg mew可以通过字典查看其类别
 47                 images += glob.glob(os.path.join(self.root,name,'*.png'))#img的完整路径
 48                 images += glob.glob(os.path.join(self.root,name,'*.jpg'))
 49             random.shuffle(images)
 50             with open(os.path.join(self.root,filename),'w') as f:
 51                 writer = csv.writer(f)
 52                 for img in images:
 53                     name = img.split(os.sep)
 54                     label = self.name2label[name[-2]]
 55                     writer.writerow([img,label])
 56          # 从csv中读取文件
 57         images, labels = [], []
 58         with open(os.path.join(self.root,filename),'r') as f:
 59             reader = csv.reader(f)
 60             for row in reader:
 61                 img,label = row
 62                 label = int(label)
 63                 images.append(img)
 64                 labels.append(label)
 65         assert len(images) == len(labels) # 保证数据长度一致
 66         return images,labels
 67 
 68     def __len__(self):
 69         return len(self.images)
 70 
 71     def __getitem__(self, idx):
 72         # idx是[0-len(self.images]
 73         # self.images,self.label
 74         # img:pokemeon\\mew\\0001.jpg(这是一个路径)要转变成img数据
 75         # label:是数字
 76         img, label = self.images[idx], self.labels[idx]
 77         tf = transforms.Compose([
 78             lambda x:Image.open(x).convert('RGB'),# string path -> img data
 79             transforms.Resize(int(self.resize*1.25), int(self.resize*1.25)),
 80             transforms.Randomrotation(15), # 旋转度数
 81             transforms.CenterCrop(self.resize),#中心裁剪,保留resize大小
 82             transforms.ToTensor(),
 83             transforms.Normalize(mean=[0.485,0.456,0.406],
 84                                  std=[0.229,0.224,0.225])  # 归一化之后,范围为-1~1,之前的图片范围为0~1
 85             ])
 86         img = tf(img)  # 将path转换成数据
 87         label = torch.tensor(label)  # 将变量label转换成tensor
 88         return img,label
 89 
 90     def denormalize(self,x_hat):
 91         mean=[0.485,0.456,0.406]
 92         std=[0.229,0.224,0.225]
 93         # x:[c,h,w]
 94         # x_hat = (x-mean)/std
 95         # maen[3]->[3,1,1]
 96         mean = torch.tensor(mean).unsqueeze(1).unsqueeze(1)
 97         std = torch.tensor(std).unsqueeze(1).unsqueeze(1)
 98         x = x_hat * std+mean
 99         return x
100 
101 def main():
102     import torchvision
103     vis = visdom.Visdom()
104     """
105     如果存储比较规范的话,可以使用下面简单的代码加载数据集,文件夹的标签从0开始编码
106     tf = transforms.Compose([
107         transforms.Resize((64,64)),
108         transforms.ToTensor()
109     ])
110     db = torchvision.datasets.ImageFolder('./pokemon',transform=tf)
111     loader = DataLoader(db,batch_size=32,shuffle=True)
112     print(db.class_to_idx) #查看类标签
113     
114     """
115     db = Pokemon('./pokemon', 224, 'train') # 根据idx,返回一个
116     x,y = next(iter(db))
117     print('sample:',x.shape,y.shape)
118     #可视化
119     vis.image(db.denormalize(x),win='sample_x',opts=dict(title = 'sample_x'))
120     # 加载一批
121     loader = DataLoader(db,batch_size = 32,shuffle=True,num_workers=8 )
122     for x,y in loader:
123         vis.images(db.denormalize(x), nrow=8, win='batch',opts=dict(title='batch'))
124         vis.text(str(y.numpy()),win='label',opts=dict(title='batch-y'))
125 
126 
127 if __name__ == '__main__':
128     main()
复制代码

 小结:

在加载自定义数据集时,一般步骤

1.定义一个类继承Dataset

2.在类中读取数据集(图片的路径),重写len函数,和getitem函数

在len函数中返回数据集的长度

在getitem函数中,处理一张图片,单个图片路径转换成图片数据(包括transform转换),返回该图片数据和标签

3,将处理好的数据集(均为张量)放入DataLoader中,进行分批

loader = DataLoader(db,batch_size = 32,shuffle=True,num_workers=8 )

4.训练时通过enumerate遍历每个batchsize

posted on   爽歪歪666  阅读(578)  评论(1编辑  收藏  举报
编辑推荐:
· SQL Server 内存占用高分析
· .NET Core GC计划阶段(plan_phase)底层原理浅谈
· .NET开发智能桌面机器人:用.NET IoT库编写驱动控制两个屏幕
· 用纯.NET开发并制作一个智能桌面机器人:从.NET IoT入门开始
· 一个超经典 WinForm,WPF 卡死问题的终极反思
阅读排行:
· 在 Windows 10 上实现免密码 SSH 登录
· C#中如何使用异步编程
· SQL Server 内存占用高分析及解决办法(超详细)
· 20250116 支付宝出现重大事故 有感
· ffmpeg简易播放器(1)--了解视频格式

< 2025年1月 >
29 30 31 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 1
2 3 4 5 6 7 8
点击右上角即可分享
微信分享提示