Ubuntu 22.04.4 深度学习环境配置
显卡为NVIDIA 4090D
显卡驱动安装成功后,输入以下命令,查看驱动支持最高的CUDA版本。
nvidia-smi
一、CUDA安装
(1)官网下载对应CUDA(Nvidia CUDA Download / CUDA Toolkit Archive | NVIDIA Developer)
以CUDA 11.8为例(师兄用12.2也未冲突)
(2)驱动安装
开网上推荐安装runfile(local),所以采用了runfile的形式。
参照官网给出的下载和安装的命令
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run sudo sh cuda_11.8.0_520.61.05_linux.run
2.接受协议
3.选择安装组件。(因为已经有显卡驱动,所以取消驱动安装)
未勾选Kernel Objects
4.安装成功后提示信息
(3)环境变量
1.打开配置文件
sudo vim ~/.bashrc
2.增加CUDA环境变量
## CUDA ENV export CUDA_HOME=/usr/local/cuda export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:${CUDA_HOME}/lib64 export PATH=${CUDA_HOME}/bin:${PATH}
3.刷新
source ~/.bashrc
(4)验证
nvcc -V
二、cuDNN
(1)安装必备软件
sudo apt-get install zlib1g
(2)官网下载(Nvidia cuDNN Download)
并未采用最新版本,点击Archive of Previous Releases-
(3)安装
解压并安装
按照提示复杂输入命令,导入CUDA GPG key
(4)更新源
sudo apt-get update
(5)安装
(6)检查
sudo dpkg -l | grep cudnn
三、Anaconda安装
(1)官网下载(https://www.anaconda.com/download/success)
(2)新建一个文件夹(我的是anaconda),并将下载的文件放在此文件夹中
(3)在终端中运行该文件
bash Anaconda3-2024.02-1-Linux-x86_64.sh
回车确认
(4)接受许可条款
接下来是一堆协议,不断按回车键跳过,当出现 Do you accept the license terms?[yes|no] 时停止按回车键,输入yes后按回车
(这里是阅读协议 想读就按回车往下读。不想读,按下英文q即可跳过。)
输入yes 默认启动conda
(5)使用命令更新终端
source ~/.bashrc
(6)验证
conda -V
或者
conda --version
(7)安装jupyter notebook
conda install jupyter notebook
(8)更新Anaconda
Anaconda的更新是非常简单的,只需要在终端里运行下面脚本:
conda update --all
如果有更新可用,conda将显示一个列表,并提示您确认更新,如果有,在终端输入“y”,就可以自动更新了。
(9)卸载
如果要从Ubuntu系统上卸载Anaconda,请删除Anaconda安装目录以及在安装过程中创建的所有文件:
rm -rf ~/anaconda3 ~/.condarc ~/.conda ~/.continuum
(比如安装时报错提示 File or directory already exists)
ERROR: File or directory already exists: '/.../anaconda3' If you want to update an existing installation, use the -u option.
python - Issues while installing Anaconda3 - Stack Overflow上的解决方法
To Reinstall: Run the following commands:
Remove anaconda3 directory rm -rf ~/anaconda3
Remove anaconda path in the PATH variable. Edit ~/.bashrc file.
Remove other hidden files. rm -rf ~/.condarc ~/.conda ~/.continuum
Re-run the installation script.
四、pytorch安装
(1)conda创建虚拟环境
conda create -n xxx python=3.9 conda activate xxx
(2)官网下载(Previous PyTorch Versions | PyTorch)
通过pytorch官网上的conda指令能安装,用pip指令也能安装,甚至下载whl文件,然后再用pip直接安装也行。我是为了方便管理,所以采用了conda进行安装
我选择的是2.1.1,(也试过2.0.X不知道为什么会显示channel中没有),安装官网的指令进行下载
conda install pytorch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 pytorch-cuda=11.8 -c pytorch -c nvidia
因为是联网下载会有一些慢,是正常现象
验证
通过python可以进行以下命令:
import torch
print(torch.__version__)
print(torch.version.cuda) # gpu
print(torch.backends.cudnn.version()) # cudnn
print(torch.cuda.is_available()) # gpu
print(torch.cuda.device_count())
也可以通过命令行直接查看
python -c "import torch; print(torch.__version__)" python -c "import torch; print(torch.version.cuda)" # gpu python -c "import torch; print(torch.cuda.is_available())" # gpu python -c "import torch; print(torch.cuda.device_count())" # gpu
参考
NIVDIA驱动、CUDA、cuDNN安装:
Ubuntu安装NVIDIA套件:驱动、CUDA、cuDNN - 知乎 (zhihu.com)
4090安装cuda11.8记录_cuda 11.8 显卡-CSDN博客
anaconda安装:
ubuntu安装anaconda并解决环境变量冲突问题 - 知乎 (zhihu.com)
在ubuntu 22.04 系统中搭建 anaconda环境 安装 jupyter notebook_ubuntu22 anaconda3-CSDN博客
pytorch安装:
安装pytorch时用wheel和用conda安装有什么区别? - 知乎 (zhihu.com)
【机器学习】PyTorch、Cuda 的安装和示例代码_pytorch cuda-CSDN博客
【conda】利用Conda创建虚拟环境,Pytorch各版本安装教程(Ubuntu)_ubuntu在conda环境安装torch教程-CSDN博客(添加镜像)