09 2019 档案
摘要:之前在用预训练的ResNet的模型进行迁移训练时,是固定除最后一层的前面层权重,然后把全连接层输出改为自己需要的数目,进行最后一层的训练,那么现在假如想要只是把 最后一层的输出改一下,不需要加载前面层的权重,方法如下: 首先模型结构是必须要传入的,然后把最后一层的输出改为自己所需的数目
阅读全文
摘要:首先注明,参考了这篇博客https://www.jianshu.com/p/4905bf8e06e5 方法1、 先序列化,格式可以是mdl,pt等 然后反序列化,再加载 方法2、 保存整个模型,格式可以是pth.tar 然后加载 还有一些在GPU和CPU之间的传输方法,具体见博客或者官方文档
阅读全文
摘要:这几天关于accuracy和loss的计算有一些疑惑,原来是自己还没有弄清楚。 给出实例 首先这样一次训练称为一个epoch,样本总数/batchsize是走完一个epoch所需的“步数”,相对应的,len(train_loader.dataset)也就是样本总数,len(train_loader)
阅读全文
摘要:最近在看DARTS的代码,有一个operations.py的文件,里面是对各类点与点之间操作的方法。 首先定义10个操作,依次解释: class PoolBN(nn.Module): """ AvgPool or MaxPool - BN """ def __init__(self, pool_ty
阅读全文
摘要:主要是介绍Inception和Xception,后续补看论文 1、首先是分组卷积的概念,分组卷积是把输入通道C_in和输出通道C_out都平均分成了n份(前提是C_in和C_out都能被n整除),然后把平均分后的输出通道concat起来,又变成了原来一样的通道数,可用下图表示: 这样做好的好处在于参
阅读全文