CUDA、cudnn安装教程, 显卡安装驱动

以下内容需要选择自己对应的版本,内容是逐步添加的,并不是整套适配。我在最近安装过程中,显卡驱动安装后发现两个问题:

  1. 显卡驱动安装后,安装合适的CUDA却会导致显卡驱动被破坏。 解决办法是使用run file代替deb安装,在选择界面不选择驱动。
  2. 显卡驱动安装后桌面丢失,这个问题是由于在安装过程中有个 X service要选择YES。如果遇到统一的问题,你可以使用startx启动xorg进程,报错信息会提示你配置有问题,如果你不知道桌面修改,就重新安装显卡驱动即可。

显卡驱动与CUDA的版本对应参考:
https://docs.nvidia.com/deploy/cuda-compatibility/index.html

显卡安装驱动

搜索显卡驱动:https://www.nvidia.cn/Download/index.aspx?lang=cn
历史版本安装:https://www.nvidia.cn/geforce/drivers/
选择自己的显卡、系统进行搜索,下载并安装!

$ sudo chmod a+x NVIDIA-Linux-x86_64-470.103.01.run
$ ./NVIDIA-Linux-x86_64-470.103.01.run -no-x-check -no-nouveau-check -no-opengl-files

注意安装过程中有一个X service是xorg进程的配置更新,要选择YES,默认在No上面,选择YES后桌面才可以使用!

CUDA安装

注意CUDA安装后要配置环境变量
资源链接:
历史版本的安装
当前最新的CUDA安装
当前以ubuntu18.04的服务器环境,安装cuda10.02

历史版本CUDA安装

选择好对应版本之后,选择操作系统等一系列信息,你可以看见如下信息:

安装命令:

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-10-2-local-10.2.89-440.33.01/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda

如图所示,根据命令在命令行执行就可以了

安装小测

在终端执行下面的命令进行cuda测试:

nvidia-smi

CUDNN安装

查找历史版本及其与CUDA的对应关系

选择系统对应的版本(我的环境切换为windows10了)

  1. 第一步
  2. 第二步
  3. 第三步
  4. 第四步
  5. 下载(windows10对应版本)
    cuda10.2对应的cudnn7.6.5.23:
https://developer.download.nvidia.cn/compute/machine-learning/cudnn/secure/7.6.5.32/Production/10.2_20191118/cudnn-10.2-windows10-x64-v7.6.5.32.zip?lSdULl8SFl_ABsp7SYDWfquUYycvAs1BC5IKjQckJJcf7RuyDq7lK1anjgmsAvgtkibFHNgBCdf-W4-Q0g7lleaLBTywu4xHrSAXBfrMaghufQFFdYhrWk6Cf6SQo8zJa0ydTBX91oAMXQnjIIhQGlhjoAkuTPDlPn3TkZv3A3q_Y29i1yopf4nIOe9TPUrXou2FpqQqcdV8EVcHU5XUxh9xl7CF64yDECsorkI

cudnn安装版本查询

方法一

$ cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

当前命令可能没有任何返回,别急,试一试下面的命令:

方法二

$ cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

若方法一、方法二都失效了,你还安装了cudnn?OK,进入/usr/local/cuda/include/下查看上面两个文件,打开文件如果内容明显很少,可能是解压的时候出现问题!

方法三

$ cat /usr/include/cudnn.h | grep CUDNN_MAJOR -A 2

安装的路径有可能比较复杂,可以根据自己的情况调整!

安装CUDNN8.4.1案例

$ cd cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive/
$ ls
include  lib  LICENSE
$ sudo cp ./include/* /usr/local/cuda/include/
$ sudo cp ./lib/* /usr/local/cuda/lib64/
# 给文件赋予权限
$ sudo chmod a+xr /usr/local/cuda/include/cudnn.h
$ sudo chmod a+xr /usr/local/cuda/lib64/libcudnn*
# 验证CUDNN
$ cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
#define CUDNN_MAJOR 8
#define CUDNN_MINOR 4
#define CUDNN_PATCHLEVEL 1
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

#endif /* CUDNN_VERSION_H */

删除原有的显卡驱动与CUDA

sudo apt-get remove --purge nvidia*
sudo apt-get remove --purge cuda* cublas*
sudo apt autoremove
# 查看包删除完没有
sudo dpkg -l | grep cuda
sudo dpkg -l | grep nvidia
sudo dpkg -P 包名

上面的命令如果删除不了显卡驱动,可以使用:

$ cd /usr/bin
$ sudo ./nvidia-uninstall

显示显卡的UUID

在设备认证的时候有用

nvidia-smi --query-gpu=uuid --format=csv
posted @ 2020-08-20 17:03  巴蜀秀才  阅读(1724)  评论(0编辑  收藏  举报