RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方法

最近再用LSTM训练模型,有时候epoch进行几次后总会出现RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED,心态都快崩了。记录一下自己踩过的坑吧,上网查了一下这个报错,大家说法不一,有人说是因为pytorch和cuda版本不对应,得重新装一下,这个方法对我来说不适用。先去pytorch官网查了CUDNN,再去论坛逛了一圈,终于有点眉目鸟。

 

 官网上的介绍,简单来说cudnn是cuda的一个工具,专门用于加速深度网络。当然不用cudnn也可以,cuda也可以用其他工具加速,但是效果肯定没这么好。

在国内网站查了半天,也没找到解决报错的方法。训练RNN模型很容易出现这个bug,在这个网站,我找到了适合我的方法https://discuss.pytorch.org/t/cuda-error-runtimeerror-cudnn-status-execution-failed/17625

方法1:

方法2:加指令  torch.backends.cudnn.enabled=False,但是运行速度会变得很慢

 

 

posted @ 2021-01-09 21:49  正在学习的小陈  阅读(25291)  评论(1编辑  收藏  举报