深度学习环境搭建（deepin20.1 + NVIDIA GTX 1080 + CUDA-10.1 + cudnn-10.1-linux-x64-v7.6.5.32 + tensorflow-2.3.2-cp37-cp37m-manylinux2010_x86_64）

参考链接：

https://blog.csdn.net/weixin_42176639/article/details/104488747

https://blog.csdn.net/insanegtp/article/details/108461944

一、关于计算机的硬件配置说明

推荐配置（该配置推荐为2018年左右信息，仅做参考）

如果您是高校学生或者高级研究人员，并且实验室或者个人资金充沛，建议您采用如下配置：

主板：X299型号或Z270型号
CPU: i7-6950X或i7-7700K 及其以上高级型号
内存：品牌内存，总容量32G以上，根据主板组成4通道或8通道
SSD：品牌固态硬盘，容量256G以上
显卡：NVIDIA GTX TITAN(XP) NVIDIA GTX 1080ti、NVIDIA GTX TITAN、NVIDIA GTX 1080、NVIDIA GTX 1070、NVIDIA GTX 1060 (顺序为优先建议，并且建议同一显卡，可以根据主板插槽数量购买多块，例如X299型号主板最多可以采用×4的显卡)
电源：由主机机容量的确定，一般有显卡总容量后再加200W即可

二、显卡安装

deepin20上的NVIDIA 显卡安装详见其它文章

https://www.cnblogs.com/lantingg/p/14675564.html

三、CUDA10.1安装

1、查看最新或合适的tensorflow版本及其对应的各驱动组件匹配情况（显卡驱动、cuda、cudnn等）：
https://tensorflow.google.cn/install/source#install_gpu_support_optional_linux_only

2、在NVIDIA官网查看cuda和显卡驱动版本对应关系（https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html）：

（如果做学习研究用，最好提前看好自己所用架构是否能支持所选cuda版本）

3、Cuda下载地址（https://developer.nvidia.com/cuda-toolkit-archive）单击左侧Cuda版本，跳转后依次选择操作系统－计算机位数－系统型号－系统版本（选ubuntu版，cuda11可选择debian版）

4、安装，最终参考官网吧，一步一步来安装说明
（不同版本官网说明不同，自行查找）
查看GPU信息：lspci | grep -i nvidia

查看系统信息：uname -m && cat /etc/*release

查看GCC信息：gcc --version

打开终端，在数据盘新建cuda安装文件夹

mkdir /media/xingzhi/BigData/apps/cuda_10.1

进入cuda安装文件所在目录

cd /media/xingzhi/MyFiles/software/nvidia

直接运行下载的.run文件安装即可（该步很重要，需谨慎，否则容易报错）

sudo ./cuda_10.1.105_418.39_linux.run --silent --toolkit --toolkitpath=/media/xingzhi/BigData/apps/cuda_10.1 --defaultroot=/media/xingzhi/BigData/apps/cuda_10.1 --samples --samplespath=/media/xingzhi/BigData/apps/cuda_10.1

继续

输入accept回车

取消掉Driver的勾选，安装其他的，Install回车，稍等安装结果如下（类似）：

建立软连接

sudo ln -s /media/xingzhi/BigData/apps/cuda_10.1 /usr/local

添加环境变量

sudo vim /etc/profile

在配置文件底部加入：

export CUDA_HOME=/usr/local/cuda_10.1
export PATH=/usr/local/cuda_10.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda_10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

然后source环境变量并重启系统

source /etc/profile

reboot

验证是否正确安装。进入实例目录

cd /usr/local/cuda/samples/1_Utilities/deviceQuery

执行：sudo make

sudo ./deviceQuery

到此cuda安装完毕。

四、cudnn下载与安装

1.下载地址官网（https://developer.nvidia.com/rdp/cudnn-download）
需要注册账号后登录，才可以下载（可在网上相应百度网盘下载源，一般要收费）

在此提供本人分享的资源：（链接: https://pan.baidu.com/s/17G5UuOTm3ufM_FiC58fqhw 密码: fjpi）

下载完成后，逐条执行一下命令（解压－复制文件到制定目录）：

tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz

sudo cp cuda/include/cudnn*.h /usr/local/cuda/include

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
进行验证，执行cat /usr/local/cuda/include/cudnn.h | grep CUDNN_ -A 2

出现以上结果则表示cudnn安装正确。

如需卸载，删除复制的文件即可，命令如下，命令一定要小心谨慎使用：
sudo rm -rf /media/xingzhi/BigData/apps/cuda_10.1/lib64/libcudnn*
sudo rm -rf /media/xingzhi/BigData/apps/cuda_10.1/include/cudnn.h

到此cudnn安装完毕

五、安装tensorflow

1、pypi网站（https://pypi.org/project/tensorflow/2.3.2/#files）下载对应版本的包

2、安装

pip install tensorflow-2.3.2-cp37-cp37m-manylinux2010_x86_64.whl

六、深度学习验证GPU使用效果（tensorflow版本大于等于2.0）

1、

# import tensorflow as tf
# tf.test.is_gpu_available() # 返回 True
# images = np.random.randn(1, 100, 100, 3)
# filters = np.zeros((1, 3, 3, 3))
# output = tf.nn.conv2d(images, filters, 2, padding='SAME')

2、

nvidia-smi

以上两种方法皆说明tensorflow调用GPU加速计算成功。

谨此以飨读者。祝大家学习快乐。

谢谢。

posted @ 2021-04-19 08:51 蘭亭客阅读(858) 评论(0) 收藏举报

刷新页面返回顶部

蘭亭客

深度学习环境搭建（deepin20.1 + NVIDIA GTX 1080 + CUDA-10.1 + cudnn-10.1-linux-x64-v7.6.5.32 + tensorflow-2.3.2-cp37-cp37m-manylinux2010_x86_64）

参考链接：

https://blog.csdn.net/weixin_42176639/article/details/104488747

一、关于计算机的硬件配置说明

推荐配置（该配置推荐为2018年左右信息，仅做参考）

公告