10 2024 档案
摘要:在做深度学习的时候经常会在这四种格式上互转。 转换时有几个需要注意的点: 1. np和cv2都能通过cv2.imshow显示出来。 2. torchvision的transforms会把HWC转为CHW。 3. from_numpy读取的HWC还是HWC,需要额外对tensor旋转。 4. pil和
阅读全文
摘要:模型参数直方图可以展示模型参数在训练过程中的分布情况。 通过直方图,可以了解模型的学习状态,识别过拟合或欠拟合问题,从而进行模型调优。 下面以ResNet18为例,显示了不同层的参数直方图。 import torchvision from matplotlib import pyplot as pl
阅读全文
摘要:可视化卷积核参数对理解卷积神经网络的工作原理、优化模型性能、提高模型泛化能力有一定帮助作用。 下面以ResNet18为例,可视化了部分卷积核参数。 import torchvision from matplotlib import pyplot as plt import torch model =
阅读全文
摘要:和FCN类似,UNet是另一个做语义分割的网络,网络从输入到输出中间呈一个U型而得名。 相比于FCN,UNet增加了更多的中间连接,能够更好处理不同尺度上的特征。 网络结构如下: 下面代码是用UNet对VOC数据集做的语义分割。 import torch import torch.nn as nn
阅读全文
摘要:深度学习中有些数据集可能不符合imagenet计算出的均值和标准差,需要根据自己的数据集单独计算。 下面这个脚本能够计算当前数据集均值和标准差。 import torch import os from PIL import Image from torchvision import transfor
阅读全文