简记配置tesorflow-gpu环境(吐血了)
之前一直都用tensorflow框架运行程序,每次配环境都相当难受,遇到的问题都是CPU版本可以运行,但是GPU版本的运行不起来,就是调不起来GPU,归结:还是版本问题.这次趁着刚刚把环境配置起来先记录一下,以防下次再出问题.
0、要安装 tensorflow-gpu ,需要处理以下几个依赖:按顺序依次为 python、CUDA driver、CUDA toolkit、cudnn;
1、python 版本
现在下载 anaconda/miniconda 默认是3.7版本的,可能会有很多问题,所以最好是新开一个 python3.6 的虚拟环境,目前python3.6相对来讲很稳定,兼容性较好,推荐。conda create -n tf36 python=3.6
其中 tf36 是环境名
可以看到有了 tf36 这个环境,但是当前还是在 base 环境下( * 表示当前环境)
conda activate tf36
切换至该环境
前面的括号里显示当前环境为 tf36
2、CUDA driver 版本nvidia-smi
确定自己的 CUDA driver 版本(因为用的是自己的电脑演示,所以借用别人的图)
3、CUDA toolkit版本
看自己的驱动对应的 CUDA toolkit 版本
比如上图为 367.57,应该下载8.0版本conda install cudatoolkit=8.0
(10.1版本是不能通过 conda 或 pip 下载的,要到官网下载)
重点来了,我的cuda driver版本是440,不能直接安装10.1,那么我就安装了10.0.130,尝试很多次,未果.实在不行 我就又把cudatoolkit==8.0安装了,对应tensorflow1.3的(下面一条提到的安装方法),还是调试不成功,我又继续试了试cudatoolkit=9.2,然后安装(4),对应tensorflow1.14版本的,总算可以了.
4、安装 tensorflow-gpu
有了前面的铺垫,直接安装 tensorflow-gpu 就可以了,tensorflow 和cudnn 的版本会自动匹配 cudatoolkit 版本conda install tensorflow-gpu
5、测试是否安装成功python
进入命令行模式import tensorflow as tf
导入 tensorflowtf.test.is_gpu_available()
如果显示 True 则大功告成
总结:
1、首先要确定CUDA驱动的版本,据此安装正确的 cudatoolkit 版本,此时再安装 tensorflow-gpu 会自动安装正确的 cudnn 和 tensorflow-gpu 版本。
2、而如果直接安装 tensorflow-gpu 的话,会默认安装最新版的 cudatoolkit 与 cudnn,极有可能与自己机器的驱动不符。
3、另外推荐安装 python3.6.还有 如果安装cudatoolkit版本高不行话,可以适当的降低一个版本或者两个版本.