cuda 卸载和安装指定(Ubuntu)

问题:安装apex的时候发现pytorch的cuda版本和机器上cuda版本不一致,导致报错

解决方案:卸载cuda并重新安装指定版本的cuda(卸载12.0版本,安装11.7版本)

解决过程:

1. 卸载旧版cuda

参考网站:How to Completely Remove CUDA from Ubuntu | Saturn Cloud Blog

然后重启电脑

2. 安装新的版本

安装依赖

sudo apt-get install g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev

在浏览器中搜索 install cuda 11.7, 打开官方链接CUDA Toolkit 11.7 Downloads | NVIDIA Developer

 选择系统的配置,然后复制下方的命令

 此处需按照每个系统的实际情况,但是最后一行要改成 sudo apt-get -y install cuda-11.7,即加上要安装的版本

把命令复制到命令行,安装

重启机器

设置环境变量

echo 'export PATH=/usr/local/cuda-11.3/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc

下载对应版本的cuDNN:cuDNN Archive | NVIDIA Developer

用 “tar -xf 文件名” 命令解压缩文件

然后用下面的命令复制文件到指定路径(注意cuda文件夹是刚刚解压出来的文件夹,如果名字不一样要替换):

sudo cp -P cuda/include/cudnn.h /usr/local/cuda-11.7/include
sudo cp -P cuda/lib/libcudnn* /usr/local/cuda-11.7/lib64/
sudo chmod a+r /usr/local/cuda-11.3/lib64/libcudnn*

然后用 nvcc -V 检查安装是否成功,如果输出Copyright和cuda版本等信息,说明成功

posted @ 2023-08-16 15:46  mnluzimu  阅读(1092)  评论(0编辑  收藏  举报