摘要:
#问题 训练网络往往需要加载预训练模型,主流的就是ResNet一类的预训练好的参数 但我在加载了预训练模型,并冻结与训练参数后,进行训练时,发现了两个问题 ##1 在进行test中model.train()的准确率要远高于model.eval()差别大概在7个点左右。 其中model.eval() 阅读全文
摘要:
#问题 感谢pycharm,我还不知道有一天我会发现这种问题,我本来是查看一下batchnorm2d中tensor的requires_grad属性,然后我就顺着快捷栏点下来的。结果发现requires_grad_()与requires_grad完全不一样。 #代码 requires_grad for 阅读全文