Windows10+Tensorflow1.12-gpu+CUDA+cudnn+Anaconda3.5+Pycharm3.5 离线GPU开发环境搭建

由于特殊原因不能连网,需要搭建一个离线的tensorflow-gpu的开发环境,折腾了几天,分享给大家,希望少走弯路。

我的配置python3.6+pycharm3.5+anaconda3-5.2.0+cuda9.0+cudnn7.5.1

一、python安装比较简单,不再叙述,Anaconda, Pycharm安装请参考下面博客,写的很好。

  https://www.jianshu.com/p/eaee1fadc1e9

二、准备工作

    下面是重要信息,一定要细读,会减少错误:

    需要验证信息和准备文件:

    (1)首先电脑必须有一块Nvidia支持显卡,可对照看是否支持:https://developer.nvidia.com/cuda-gpus

    (2)验证自己电脑自带驱动支持的CUDA版本。https://jingyan.baidu.com/article/d169e1861b759f436611d882.html

        如果找不到Nvidia控制面板或者打不开,请自行搜索。

        如果需要卸载重装驱动,请卸载后使用该工具清理,否则后续安装cuda时会报错。https://blog.csdn.net/bingo_6/article/details/80114440

    (3)下载对应的CUDA版本,在此强调,不是必须要完全对应,不隔代不大即可,最好对应。https://developer.nvidia.com/cuda-toolkit-archive

    (4)下载和CUDA对应的cudnn,必须和CUDA版本对应,需要注册。https://developer.nvidia.com/rdp/cudnn-archive

    (5)下载tensorflow-gpu,打开后面链接,拉到最后,找到对应cuda, cudnn, python的版本。https://tensorflow.google.cn/install/source_windows

        下载地址:https://pypi.org/project/tensorflow-gpu/1.4.0/#files

    (6)tensorboard等各种安装包(包含python):可参考博客对应部分->https://www.twblogs.net/a/5bb2313d2b71770e645dd114

        下载地址清华镜像,网络好的建议去官网:https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/

    (7)可查看CUDA和驱动的版本相互关系,仅供参考,不必严格执行。https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

    (8)下载Microsoft Visual C++ Redistributable for Visual Studio 2017,拉到后面链接页面最下端“可再发行组件和生成工具”,https://visualstudio.microsoft.com/zh-hans/vs/older-downloads/

        特别强调,有很多文章说必须下载visual studio,其实不必,特别对于离线来说,安装visual studio简直就是灾难。这里只需要安装Visual C++ Redistributable 组件即可,因为编译cuda需要这个vc++组件。cuda9以上用2017,以下用2015版本。

三、按顺序安装

  1. python,pycharm,anaconda

  2. 安装Microsoft Visual C++ Redistributable

  3. 安装驱动(如果需要的话),安装前一定要清理干净。卸载所有Nvidia软件->删除C:\ProgramFiles\NVIDIA GPU Computing Toolkit和C:\ProgramFiles\NVIDIA Corporation 和C:\ProgramData\NVIDIA Corporation文件夹->用该工具清理后重启->安装驱动。https://blog.csdn.net/bingo_6/article/details/80114440

  4. 安装CUDA,安装时建议选择自定义,而且只勾选CUDA一个大复选框,其它不选,特别是driver,它会卸载你现有的驱动,重新安装新的驱动,可能会有问题。补丁依次安装即可。

   安装完检测:

   cmd打开命令行模式,输入:nvcc -V ,会输出 cuda版本号等信息。

   

   编译文件验证,无需visual studio,都出现 Result=Pass 即可。可参考上半部分:https://blog.csdn.net/u013165921/article/details/77891913

   配置环境变量,安装完会自动添加环境变量,另外我们需手动添加到path变量:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin, C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin\lib\x64, C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib, C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\libnvvp, C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\CUPTI\libx64。

   

 

  5. 安装cudnn,这个主要配置文件和配置环境。

   解压缩我们下载的CuDnn文件,得到3个文件夹:bin, include, lib。将这个三个文件夹下对应的文件复制到“C:\ProgramFiles\NVIDIA GPU Computing Toolkit\v9.0”对应文件夹下。

  6. 安装tensorflow-gpu, 要选择下载对应的版本。这里麻烦的是需要很多依赖安装包,在第二部分6里面可参考。

   可提前下载好各种安装包,或者每操作一步会看到提示需要新的依赖包,然后再去下载再pip安装,都很麻烦。或者在一台连网的配置相似的电脑上面先装一遍,然后把安装包copy到离线电脑上,不知有无问题,简便但有风险。

   安装完cmd打开命令行,输入python,然后import tensorflow as tf, sess = tf.Session(),看有无报错,能输出GPU显卡信息算成功。

四、报错

  如果你严格按照上面的步骤操作,而且版本对应和环境配置都没问题,一般不会报错。

  1. 安装CUDA快到最后时报“NVIDIA Install Application已停止工作”

   该问题为驱动没有安装成功原因,未清理干净,解决可参考第三部分第3条操作。

  2. import tensorflow as tf 时报“ImportError: DLL load failed: 找不到指定的模块”

   这个问题主要是缺少动态链接库.dll,解决方法:做好TensorFlow-gpu和cuda/cudnn的版本匹配,然后安装相应的Visual C++ 库运行时组件就可以了。

   Visual C++ 库运行时组件一定要在安装CUDA前安装,仔细检查TensorFlow-gpu和cuda/cudnn的版本匹配问题。如果要想知道缺了哪些.dll文件,可参考:           https://blog.csdn.net/happy_hui520/article/details/94548768

posted @ 2019-07-16 11:32  Sunshine168  阅读(626)  评论(0编辑  收藏  举报