11 2018 档案

摘要:1、问题描述: pytorch中,在测试阶段进行前向推断运行时,随着for循环次数的增加,显存不断累加变大,最终导致显存溢出。 2、解决方法: 使用如下代码处理输入数据: 假设X为模型的输入 X = X.cuda() input_blobs = Variable(X, volatile=True) 阅读全文
posted @ 2018-11-05 18:13 blackx 阅读(4475) 评论(0) 推荐(0) 编辑
摘要:1、检查输入数据和target中是否有 nan 值。 np.any(np.isnan(x)) np.any(np.isnan(target)) 2、减小loss 3、rnn中发生梯度爆炸,检查参数值和参数梯度,截断梯度。 阅读全文
posted @ 2018-11-02 14:00 blackx 阅读(7133) 评论(0) 推荐(0) 编辑