CUDA、cudnn安装教程, 显卡安装驱动
目录
以下内容需要选择自己对应的版本,内容是逐步添加的,并不是整套适配。我在最近安装过程中,显卡驱动安装后发现两个问题:
- 显卡驱动安装后,安装合适的CUDA却会导致显卡驱动被破坏。 解决办法是使用run file代替deb安装,在选择界面不选择驱动。
- 显卡驱动安装后桌面丢失,这个问题是由于在安装过程中有个 X service要选择YES。如果遇到统一的问题,你可以使用startx启动xorg进程,报错信息会提示你配置有问题,如果你不知道桌面修改,就重新安装显卡驱动即可。
显卡驱动与CUDA的版本对应参考:
https://docs.nvidia.com/deploy/cuda-compatibility/index.html
显卡安装驱动
搜索显卡驱动:https://www.nvidia.cn/Download/index.aspx?lang=cn
历史版本安装:https://www.nvidia.cn/geforce/drivers/
选择自己的显卡、系统进行搜索,下载并安装!
$ sudo chmod a+x NVIDIA-Linux-x86_64-470.103.01.run
$ ./NVIDIA-Linux-x86_64-470.103.01.run -no-x-check -no-nouveau-check -no-opengl-files
注意安装过程中有一个X service是xorg进程的配置更新,要选择YES,默认在No上面,选择YES后桌面才可以使用!
CUDA安装
注意CUDA安装后要配置环境变量
资源链接:
历史版本的安装
当前最新的CUDA安装
当前以ubuntu18.04的服务器环境,安装cuda10.02
历史版本CUDA安装
选择好对应版本之后,选择操作系统等一系列信息,你可以看见如下信息:
安装命令:
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-10-2-local-10.2.89-440.33.01/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda
如图所示,根据命令在命令行执行就可以了
安装小测
在终端执行下面的命令进行cuda测试:
nvidia-smi
CUDNN安装
选择系统对应的版本(我的环境切换为windows10了)
- 第一步
- 第二步
- 第三步
- 第四步
- 下载(windows10对应版本)
cuda10.2对应的cudnn7.6.5.23:
https://developer.download.nvidia.cn/compute/machine-learning/cudnn/secure/7.6.5.32/Production/10.2_20191118/cudnn-10.2-windows10-x64-v7.6.5.32.zip?lSdULl8SFl_ABsp7SYDWfquUYycvAs1BC5IKjQckJJcf7RuyDq7lK1anjgmsAvgtkibFHNgBCdf-W4-Q0g7lleaLBTywu4xHrSAXBfrMaghufQFFdYhrWk6Cf6SQo8zJa0ydTBX91oAMXQnjIIhQGlhjoAkuTPDlPn3TkZv3A3q_Y29i1yopf4nIOe9TPUrXou2FpqQqcdV8EVcHU5XUxh9xl7CF64yDECsorkI
cudnn安装版本查询
方法一
$ cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
当前命令可能没有任何返回,别急,试一试下面的命令:
方法二
$ cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
若方法一、方法二都失效了,你还安装了cudnn?OK,进入/usr/local/cuda/include/
下查看上面两个文件,打开文件如果内容明显很少,可能是解压的时候出现问题!
方法三
$ cat /usr/include/cudnn.h | grep CUDNN_MAJOR -A 2
安装的路径有可能比较复杂,可以根据自己的情况调整!
安装CUDNN8.4.1案例
$ cd cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive/
$ ls
include lib LICENSE
$ sudo cp ./include/* /usr/local/cuda/include/
$ sudo cp ./lib/* /usr/local/cuda/lib64/
# 给文件赋予权限
$ sudo chmod a+xr /usr/local/cuda/include/cudnn.h
$ sudo chmod a+xr /usr/local/cuda/lib64/libcudnn*
# 验证CUDNN
$ cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
#define CUDNN_MAJOR 8
#define CUDNN_MINOR 4
#define CUDNN_PATCHLEVEL 1
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)
#endif /* CUDNN_VERSION_H */
删除原有的显卡驱动与CUDA
sudo apt-get remove --purge nvidia*
sudo apt-get remove --purge cuda* cublas*
sudo apt autoremove
# 查看包删除完没有
sudo dpkg -l | grep cuda
sudo dpkg -l | grep nvidia
sudo dpkg -P 包名
上面的命令如果删除不了显卡驱动,可以使用:
$ cd /usr/bin
$ sudo ./nvidia-uninstall
显示显卡的UUID
在设备认证的时候有用
nvidia-smi --query-gpu=uuid --format=csv
清澈的爱,只为中国