RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方法

最近再用LSTM训练模型，有时候epoch进行几次后总会出现RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED，心态都快崩了。记录一下自己踩过的坑吧，上网查了一下这个报错，大家说法不一，有人说是因为pytorch和cuda版本不对应，得重新装一下，这个方法对我来说不适用。先去pytorch官网查了CUDNN，再去论坛逛了一圈，终于有点眉目鸟。

官网上的介绍，简单来说cudnn是cuda的一个工具，专门用于加速深度网络。当然不用cudnn也可以，cuda也可以用其他工具加速，但是效果肯定没这么好。

在国内网站查了半天，也没找到解决报错的方法。训练RNN模型很容易出现这个bug，在这个网站，我找到了适合我的方法https://discuss.pytorch.org/t/cuda-error-runtimeerror-cudnn-status-execution-failed/17625

方法1：

方法2：加指令 torch.backends.cudnn.enabled=False，但是运行速度会变得很慢

posted @ 2021-01-09 21:49 正在学习的小陈阅读(26052) 评论(1) 收藏举报

刷新页面返回顶部

正在学习的小陈

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方法

公告