随笔分类 - 深度学习
摘要:原因:应该是环境变量没加载好,导致每开一个tmux窗口都需要对重新source一下~/.bashrc 解决方案:source ~/.bachrc
阅读全文
摘要:问题描述 跑一个模型,加载预训练权重,只进行推理,没有修改任何代码,刚开始直接运行可以得到推理结果,然后再跑,程序又卡住了;然后我使用调试,一会能跑,一会跑到第五六个batch时,又卡住了。 解决方法 修改dataloader的num_workers。我程序原来workers设为的8,后面改为4就可
阅读全文
摘要:# 原因 多卡训练;单卡模糊加载进行测试。 训练时,通过torch.nn.DataParallel(self.model)进行多卡并行训练;测试时,用单卡模糊加载保存的模型权重,很多模型参数都没有加载成功,自然会导致测试效果很差。 # 解决方法 测试时,使用多卡加载模型时,删掉'module.'前缀
阅读全文
摘要:报错的代码: ` parser.add_argument('data', type=str, default='/home/user1/datasets/cifar10', help='path to dataset') ` 在data前加"--",修改后的代码: ` parser.add_argu
阅读全文
摘要:问题描述 3090显卡,运行示例代码报错。 解决方法 export PATH="$PATH:/usr/local/cuda/bin/nvcc"
阅读全文