cuda 卸载和安装指定(Ubuntu)
问题:安装apex的时候发现pytorch的cuda版本和机器上cuda版本不一致,导致报错
解决方案:卸载cuda并重新安装指定版本的cuda(卸载12.0版本,安装11.7版本)
解决过程:
1. 卸载旧版cuda
参考网站:How to Completely Remove CUDA from Ubuntu | Saturn Cloud Blog
然后重启电脑
2. 安装新的版本
安装依赖
sudo apt-get install g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev
在浏览器中搜索 install cuda 11.7, 打开官方链接CUDA Toolkit 11.7 Downloads | NVIDIA Developer
选择系统的配置,然后复制下方的命令
此处需按照每个系统的实际情况,但是最后一行要改成 sudo apt-get -y install cuda-11.7,即加上要安装的版本
把命令复制到命令行,安装
重启机器
设置环境变量
echo 'export PATH=/usr/local/cuda-11.3/bin:$PATH' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
下载对应版本的cuDNN:cuDNN Archive | NVIDIA Developer
用 “tar -xf 文件名” 命令解压缩文件
然后用下面的命令复制文件到指定路径(注意cuda文件夹是刚刚解压出来的文件夹,如果名字不一样要替换):
sudo cp -P cuda/include/cudnn.h /usr/local/cuda-11.7/include sudo cp -P cuda/lib/libcudnn* /usr/local/cuda-11.7/lib64/ sudo chmod a+r /usr/local/cuda-11.3/lib64/libcudnn*
然后用 nvcc -V 检查安装是否成功,如果输出Copyright和cuda版本等信息,说明成功