解决重复运行Tensorflow程序GPU内存占用的小白方法
作为一个刚入门CV的新手,最近在运行一个生成人脸图像的程序时遇到了问题,程序是可以运行的,但是运行两次后就会出错,具体如下:
ResourceExhaustedError: 2 root error(s) found. (0) Resource exhausted: OOM when allocating tensor with shape[1,3,3,512,512] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc [[{{node G_synthesis_5/_Run/G_synthesis/64x64/Conv0_up/Square}}]] Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info. [[G_synthesis_5/_Run/saturate_cast/_4577]] Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info. (1) Resource exhausted: OOM when allocating tensor with shape[1,3,3,512,512] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc [[{{node G_synthesis_5/_Run/G_synthesis/64x64/Conv0_up/Square}}]] Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info. 0 successful operations. 0 derived errors ignored.
先介绍下我的运行环境:
- Win 10
- Spyder
- Tensorflow-GPU == 1.14.0
查到的原因是GPU显存不够了。
第一次运行,专用GPU内存:0 ===> 1.2,第二次运行:1.2 ===> 1.6,第三次就没有办法运行了,由于自己的电脑是渣渣显卡,显存太小,而我的程序是需要不断改变参数重复运行的,但网上查了一遍说显存是不会运行一次就释放资源的,所以我不得不每运行两次就重启Spyder这样来释放显存。也尝试过运行一次后就杀掉显卡中的这个程序,但结果是直接导致Spyder内核连接中断,结果还是重启。
最后,灵机一动,直接在控制台
重启内核就可以释放掉程序以及所占显存资源,这样就不用重启麻烦了。
如果是一段连续程序显存不够,那就要么换大一点显存的显卡,或者设置每次占用GPU资源的值了。这个可以看看其他博主的博客。
方法不高级,但挺实用,如果有更好的方法,欢迎留言评论。