深度学习环境搭建(deepin20.1 + NVIDIA GTX 1080 + CUDA-10.1 + cudnn-10.1-linux-x64-v7.6.5.32 + tensorflow-2.3.2-cp37-cp37m-manylinux2010_x86_64)

参考链接:

https://blog.csdn.net/weixin_42176639/article/details/104488747

https://blog.csdn.net/insanegtp/article/details/108461944

一、关于计算机的硬件配置说明

推荐配置(该配置推荐为2018年左右信息,仅做参考)

如果您是高校学生或者高级研究人员,并且实验室或者个人资金充沛,建议您采用如下配置:

  • 主板:X299型号或Z270型号
  • CPU: i7-6950X或i7-7700K 及其以上高级型号
  • 内存:品牌内存,总容量32G以上,根据主板组成4通道或8通道
  • SSD: 品牌固态硬盘,容量256G以上
  • 显卡:NVIDIA GTX TITAN(XP) NVIDIA GTX 1080ti、NVIDIA GTX TITAN、NVIDIA GTX 1080、NVIDIA GTX 1070、NVIDIA GTX 1060 (顺序为优先建议,并且建议同一显卡,可以根据主板插槽数量购买多块,例如X299型号主板最多可以采用×4的显卡)
  • 电源:由主机机容量的确定,一般有显卡总容量后再加200W即可

二、显卡安装

deepin20上的NVIDIA 显卡安装详见其它文章

https://www.cnblogs.com/lantingg/p/14675564.html

 

三、CUDA10.1安装

1、查看最新或合适的tensorflow版本及其对应的各驱动组件匹配情况(显卡驱动、cuda、cudnn等):
https://tensorflow.google.cn/install/source#install_gpu_support_optional_linux_only

 

 

 2、在NVIDIA官网查看cuda和显卡驱动版本对应关系(https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html):

(如果做学习研究用,最好提前看好自己所用架构是否能支持所选cuda版本)

3、Cuda下载地址https://developer.nvidia.com/cuda-toolkit-archive)单击左侧Cuda版本,跳转后依次选择操作系统-计算机位数-系统型号-系统版本(选ubuntu版,cuda11可选择debian版)

 

 4、安装,最终参考官网吧,一步一步来安装说明
(不同版本官网说明不同,自行查找)
查看GPU信息:lspci | grep -i nvidia

 

 查看系统信息:uname -m && cat /etc/*release

  查看GCC信息:gcc --version

 打开终端,在数据盘新建cuda安装文件夹

mkdir /media/xingzhi/BigData/apps/cuda_10.1

进入cuda安装文件所在目录

cd /media/xingzhi/MyFiles/software/nvidia

直接运行下载的.run文件安装即可(该步很重要,需谨慎,否则容易报错)

sudo ./cuda_10.1.105_418.39_linux.run --silent --toolkit --toolkitpath=/media/xingzhi/BigData/apps/cuda_10.1 --defaultroot=/media/xingzhi/BigData/apps/cuda_10.1 --samples --samplespath=/media/xingzhi/BigData/apps/cuda_10.1

继续

  输入accept回车

  取消掉Driver的勾选,安装其他的,Install回车,稍等安装结果如下(类似):

 建立软连接

sudo ln -s /media/xingzhi/BigData/apps/cuda_10.1 /usr/local

添加环境变量

sudo vim /etc/profile

在配置文件底部加入:

export CUDA_HOME=/usr/local/cuda_10.1
export PATH=/usr/local/cuda_10.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda_10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

然后source环境变量并重启系统

source /etc/profile

reboot

 验证是否正确安装。进入实例目录

cd /usr/local/cuda/samples/1_Utilities/deviceQuery

执行:sudo make

 sudo ./deviceQuery

 到此cuda安装完毕。

 

四、cudnn下载与安装

1.下载地址官网(https://developer.nvidia.com/rdp/cudnn-download)
需要注册账号后登录,才可以下载(可在网上相应百度网盘下载源,一般要收费)

在此提供本人分享的资源:(链接: https://pan.baidu.com/s/17G5UuOTm3ufM_FiC58fqhw  密码: fjpi)

下载完成后,逐条执行一下命令(解压-复制文件到制定目录):

tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz

sudo cp cuda/include/cudnn*.h /usr/local/cuda/include

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
进行验证,执行cat /usr/local/cuda/include/cudnn.h | grep CUDNN_ -A 2

出现以上结果则表示cudnn安装正确。

如需卸载,删除复制的文件即可,命令如下,命令一定要小心谨慎使用:
sudo rm -rf /media/xingzhi/BigData/apps/cuda_10.1/lib64/libcudnn*
sudo rm -rf /media/xingzhi/BigData/apps/cuda_10.1/include/cudnn.h

到此cudnn安装完毕

 

五、安装tensorflow

1、pypi网站(https://pypi.org/project/tensorflow/2.3.2/#files)下载对应版本的包

2、安装

pip install tensorflow-2.3.2-cp37-cp37m-manylinux2010_x86_64.whl

 

六、深度学习验证GPU使用效果(tensorflow版本大于等于2.0)

1、

# import tensorflow as tf
# tf.test.is_gpu_available() # 返回 True
# images = np.random.randn(1, 100, 100, 3)     
# filters = np.zeros((1, 3, 3, 3))
# output = tf.nn.conv2d(images, filters, 2, padding='SAME')

 

 2、

nvidia-smi

 

 以上两种方法皆说明tensorflow调用GPU加速计算成功。

谨此以飨读者。祝大家学习快乐。

谢谢。

posted @ 2021-04-19 08:51  蘭亭客  阅读(680)  评论(0编辑  收藏  举报