第四次作业猫狗大战

猫狗大战练习

我们将要建立一个模型来进行AI研习社中的猫狗大战竞赛，在这里有20000张猫狗的图片用于训练，还有两千张图片用于测试。对集中且分散的猫狗图片进行分类。

一、首先判断是否存在GPU设备

二、下载数据

我们可以在猫狗大战的官网进行下载，注意这里下载的为.rar文件，我们需要通过! unrar x cat_dog.rar进行解压

三、

数据处理

datasets 是 torchvision 中的一个包，可以用做加载图像数据。它可以以多线程（multi-thread）的形式从硬盘中读取数据，使用 mini-batch 的形式，在网络训练中向 GPU 输送。在使用CNN处理图像时，需要进行预处理。图片将被整理成 $224\times 224 \times 3$ 的大小，同时还将进行归一化处理。

torchvision 支持对输入数据进行一些复杂的预处理/变换（normalization, cropping, flipping, jittering 等）。具体可以参照 torchvision.tranforms 的官方文档说明。

四、创建VGG模型

torchvision中集成了很多在 ImageNet （120万张训练数据）上预训练好的通用的CNN模型，可以直接下载使用。

在本课程中，我们直接使用预训练好的 VGG 模型。同时，为了展示 VGG 模型对本数据的预测结果，还下载了 ImageNet 1000 个类的 JSON 文件。

在这部分代码中，对输入的5个图片利用VGG模型进行预测，同时，使用softmax对结果进行处理，随后展示了识别结果。可以看到，识别结果是比较非常准确的。

五、修改最后一层，冻结前面层的参数

VGG 模型如下图所示，注意该网络由三种元素组成：

卷积层（CONV）是发现图像中局部的 pattern

全连接层（FC）是在全局上建立特征的关联

池化（Pool）是给图像降维以提高特征的 invariance

我们的目标是使用预训练好的模型，因此，需要把最后的 nn.Linear 层由1000类，替换为2类。为了在训练中冻结前面层的参数，需要设置 required_grad=False。这样，反向传播训练梯度时，前面层的权重就不会自动更新了。训练中，只会更新最后一层的参数。

六、训练并测试全连接层

包括三个步骤：第1步，创建损失函数和优化器；第2步，训练模型；第3步，测试模型。

1.训练模型：

2.验证模型

测试模型

将预测结果保存到mhy.csv文件里

posted @ 2021-10-23 23:50 qiaa 阅读(72) 评论(0) 编辑收藏举报

刷新页面返回顶部