深度学习环境搭建:window10+CUDA10.0+CUDNN+pytorch1.2.0
去年底入手一台联想Y7000P,配置了Nvidia GeForce GTX 1660 Ti GPU,GPU内存6G,但是因为有GPU服务器,所以一直没有在这台笔记本上跑过模型,如今经过一番折腾,终于在此笔记本上搭建好了环境,并成功使用GPU训练了一些模型,本篇记录了环境搭建的过程。
注意:
1、CUDA和CUDNN不是必须另外安装的(当然装了也没关系),除非你要开发CUDA程序,否则如果只是用pytorch等框架,则只需要使用 CUDA 的动态链接库,而这部分在使用conda安装pytorch的时候会一起安装好,也就是说使用conda 安装pytorch之后,无需另外单独安装CUDA和CUDNN,并且你会发现在本地库中有一个cudatoolkit 的包被安装了。但是,如果要为 Pytorch 添加 CUDA 的相关扩展时(参考:https://tutorials.pytorch.kr/advanced/cpp_extension.html ),会对编写的 CUDA 相关程序进行编译等操作,那么就需另外单独安装CUDA和CUDNN.
2、pytorch1.2.0版本在使用tensorboard的时候有很多坑,比如网络图无法正常显示,所以建议安装1.2.0以上的版本,后来我装了最新的稳定版1.5.0,对应的torchvision是0.6.0
一、检查你的GPU
首先确保你的电脑有Nvidia的GPU,并且支持CUDA,可以参考这个网址。
二、安装vs2017(可选)
Visual Studio 2017 Community下载地址
安装选项:勾选“C++的桌面开发”,右边的列表再额外勾选一个SDK,这个SDK是在后续测试CUDA样例的时候要用到的,如下图:
三、安装CUDA10.0(可选)
下载
打开网站:CUDA10.0
按照下图选择对应的选项后,点击下载:
安装
双击下载的文件,选择自定义安装,如果之前你已经安装过显卡驱动并且兼容CUDA10.0,可以在这里去掉显卡驱动的勾选,兼容情况参考这里,截图如下:
另外,去掉Visual studio integration的勾选:
后面默认选择下一步,等待安装完成。
测试
命令行测试:
nvcc -V
输出以下信息即成功:
样例测试:
以管理员方式打开vs2017,然后加载bandwidthTest解决方案,路径如下:
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.0\1_Utilities\bandwidthTest\bandwidthTest_vs2017.vcxproj
右键点击bandwidthTest,选择生成,等待生成结果成功。此时在路径:C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.0\bin\win64\Debug 下,会出现一个bandwidthTest.exe文件,在cmd中执行,结果为PASS则为通过测试。
另外还有一个deviceQuery的样例,其测试过程同上。
四、安装CUDNN(可选)
打开CUDNN的网址
如下图,选择后会下载:
下载文件解压缩出来,然后根据下面的步骤操作(图中拿10.2举例的,因为是官方的教程):
五、安装pytorch
添加conda的清华镜像源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
添加额外的pytorch源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch
安装
conda config --set show_channel_urls yes
conda install pytorch=1.5.0 torchvision=0.6.0 cudatoolkit=10.1
到此安装就完成了。
ok,本篇就这么多内容啦~,感谢阅读O(∩_∩)O。