运维系列&AI系列&Lenovo-G双系统系列(前传-装之前搜索的):ubuntu22.04安装nvidia驱动+cuda11.7+cudnn8.6
ubuntu22.04安装nvidia驱动+cuda11.7+cudnn8.6
ubuntu22.04安装nvidia驱动+cuda11.7+cudnn8.6
写在前面:虚拟机用户别试了,不适用于虚拟机。
更新日期:2023/04/05
显卡配置:3080ti双卡
一、下载驱动
https://www.nvidia.cn/Download/index.aspx?lang=cn
根据你的需要选择驱动,然后点击搜索,然后下载
image.png
下载完成后得到一个.run的包:
image.png
二、安装(最好在ssh界面或者tty进行,因为待会关掉GPU进程可能会黑屏)
1. 获得超级用户权限
sudo -i
2. 关闭所有使用 GPU 的进程
sudo systemctl isolate multi-user.target
sudo modprobe -r nvidia-drm
3. 安装NVIDIA 驱动(运行之后,里面的“X”表示的是勾选,根据自己的需求选择)
sudo sh ./NVIDIA-Linux-x86_64-XX.sh
4. 打开图形界面
这里有个小插曲:需要确定自己的ubuntu
用的是什么图形界面:gdm
,gdm3
还是lightdm
cat /etc/X11/default-display-manager
我的是gdm3
,所以:
sudo systemctl start gdm3.service
5. 重启系统
sudo reboot
三、验证nvidia驱动是否装好
nvidia-smi
能正常显示
image.png
四、下载安装cuda
1.确定自己能装的cuda版本:
方法一:
nvidia-smi
右上角,CUDA Version
就是能装的最高的版本号,比如我这里是11.7
方法二:
在CUDA Downloads下面的Resources
中点击CUDA Documentation/Release Notes就可以查看想要下载的CUDA
需要什么版本的驱动(这里的CUDA Downloads
超链接默认是最新版本的cuda
,如果需要的不是最新版本,看下面2的链接)
2.下载:
https://developer.nvidia.com/cuda-toolkit-archive
下图左边的框框是下载链接,点进去,根据自己的电脑配置选择。
右边是对应版本的在线文档,英文好的同学可以直接看英文文档安装。
image.png
cuda
有好几种安装方式,在上面的官方文档有提及到。我这里选择的是和安装驱动一样,下载的是.run文件
安装,官方文档如下:
image.png
3.安装
sudo sh cuda_<version>_linux.run
取消勾选安装驱动(这一句写给我自己看的,因为我这篇文章的第一节已经安装驱动了,同学们根据自己的需求来)
安装完了之后会显示(图是第一次装11.8的时候截图的,第二次我装的是11.7):
b154a1c6aaf1e7ab13988d103fcb399.jpg
提示我们添加环境变量:
sudo vim /etc/profile
末尾加上:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.7/lib64
export PATH=$PATH:/usr/local/cuda-11.7/bin
export CUDA_HOME=/usr/local/cuda-11.7
这其中版本号可以根据自己的实际版本来,或者直接不要版本号也行,因为/usr/local目录
下有个cuda目录
,映射到cuda-xx.x文件夹
。
然后
source /etc/profile
4.验证cuda:
nvcc -V
如果出现重新打开终端不生效的问题:
vim ~/.bashrc
末尾加上:
source /etc/profile
然后:
source ~/.bashrc
五、卸载cuda(如果装错版本的话)
xx.x是版本号
cd /usr/local/cuda-xx.x/bin/
sudo ./cuda-uninstaller
sudo rm -rf /usr/local/cuda-xx.x
六、下载安装cudnn
1.两种方法的选择:
deb和tar方法
推荐deb方法,因为:
使用tar方法安装不会有cudnn_samples_v8这个文件,无法使用官方的安装完成验证方式。
deb方法简单。
2、下载,根据官方文档来安装:
下载地址:
https://developer.nvidia.com/rdp/cudnn-download
官方文档地址:
https://docs.nvidia.com/deeplearning/cudnn/index.html
最后三步有坑:
image.png
比如我下的是8.6.0.163,cuda是11.7,按照官方文档的说法,应该是:
sudo apt-get install libcudnn8=8.6.0.163-1+cuda11.7
但实际上,对应的libcudnn8
,cuda版本号
只有最新的,不信你查一下:
sudo apt-cache madison packageName
sudo apt-cache madison libcudnn8
写这篇文章的时候,cuda
已经出到11.8
了,不过没事,向下兼容
所以我这里是
sudo apt-get install libcudnn8=8.6.0.163-1+cuda11.8
blabla此处省略剩下两条命令
3.验证:
(只有deb方法安装的才能用)根据官方文档验证:
cp -r /usr/src/cudnn_samples_v8/ $HOME
cd $HOME/cudnn_samples_v8/mnistCUDNN
make clean && make
./mnistCUDNN
Test passed!
七、卸载cudnn(如果用的上的话)
sudo rm -rf /usr/local/cuda/include/cudnn*.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*
sudo rm -rf /usr/include/cudnn*.h
sudo rm -rf /usr/lib/x86_64-linux-gnu/libcudnn*
八、最关键的一步:如果对你有帮助的话,点个赞