Ubuntu 22.04.4 深度学习环境配置

显卡为NVIDIA 4090D

 

显卡驱动安装成功后,输入以下命令,查看驱动支持最高的CUDA版本。

nvidia-smi

一、CUDA安装

(1)官网下载对应CUDA(Nvidia CUDA Download / CUDA Toolkit Archive | NVIDIA Developer

以CUDA 11.8为例(师兄用12.2也未冲突)

 

 (2)驱动安装

开网上推荐安装runfile(local),所以采用了runfile的形式。

参照官网给出的下载和安装的命令

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
sudo sh cuda_11.8.0_520.61.05_linux.run

2.接受协议

3.选择安装组件。(因为已经有显卡驱动,所以取消驱动安装)

未勾选Kernel Objects

4.安装成功后提示信息

(3)环境变量

1.打开配置文件

sudo vim ~/.bashrc

2.增加CUDA环境变量

## CUDA ENV
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}

3.刷新

source ~/.bashrc

(4)验证

nvcc -V

二、cuDNN

(1)安装必备软件

sudo apt-get install zlib1g

(2)官网下载(Nvidia cuDNN Download

并未采用最新版本,点击Archive of Previous Releases-

 

(3)安装

解压并安装

 

按照提示复杂输入命令,导入CUDA GPG key

 

(4)更新源

sudo apt-get update

(5)安装

 

(6)检查

sudo dpkg -l | grep cudnn

三、Anaconda安装

(1)官网下载(https://www.anaconda.com/download/success)

(2)新建一个文件夹(我的是anaconda),并将下载的文件放在此文件夹中

(3)在终端中运行该文件

bash Anaconda3-2024.02-1-Linux-x86_64.sh

回车确认

(4)接受许可条款

接下来是一堆协议,不断按回车键跳过,当出现 Do you accept the license terms?[yes|no] 时停止按回车键,输入yes后按回车

 (这里是阅读协议 想读就按回车往下读。不想读,按下英文q即可跳过。)

 输入yes 默认启动conda

(5)使用命令更新终端

source ~/.bashrc

(6)验证

conda -V
或者
conda --version

(7)安装jupyter notebook

conda install jupyter notebook

(8)更新Anaconda

Anaconda的更新是非常简单的,只需要在终端里运行下面脚本:

conda update --all

如果有更新可用,conda将显示一个列表,并提示您确认更新,如果有,在终端输入“y”,就可以自动更新了。

(9)卸载

如果要从Ubuntu系统上卸载Anaconda,请删除Anaconda安装目录以及在安装过程中创建的所有文件:

rm -rf ~/anaconda3 ~/.condarc ~/.conda ~/.continuum

 

(比如安装时报错提示 File or directory already exists)

ERROR: File or directory already exists: '/.../anaconda3'
If you want to update an existing installation, use the -u option.

python - Issues while installing Anaconda3 - Stack Overflow上的解决方法

To Reinstall: Run the following commands:

Remove anaconda3 directory rm -rf ~/anaconda3
Remove anaconda path in the PATH variable. Edit ~/.bashrc file.
Remove other hidden files. rm -rf ~/.condarc ~/.conda ~/.continuum
Re-run the installation script.

 四、pytorch安装

(1)conda创建虚拟环境

conda create -n xxx python=3.9
conda activate xxx

(2)官网下载(Previous PyTorch Versions | PyTorch) 

通过pytorch官网上的conda指令能安装,用pip指令也能安装,甚至下载whl文件,然后再用pip直接安装也行。我是为了方便管理,所以采用了conda进行安装

我选择的是2.1.1,(也试过2.0.X不知道为什么会显示channel中没有),安装官网的指令进行下载

conda install pytorch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 pytorch-cuda=11.8 -c pytorch -c nvidia

因为是联网下载会有一些慢,是正常现象

 

验证

 通过python可以进行以下命令:

import torch

print(torch.__version__)
print(torch.version.cuda) # gpu
print(torch.backends.cudnn.version()) # cudnn 
print(torch.cuda.is_available())  # gpu
print(torch.cuda.device_count())

也可以通过命令行直接查看

python -c "import torch; print(torch.__version__)"
python -c "import torch; print(torch.version.cuda)"  # gpu
python -c "import torch; print(torch.cuda.is_available())"  # gpu
python -c "import torch; print(torch.cuda.device_count())"  # gpu

 

 

 

 

 

 

 

 

 

 

参考

NIVDIA驱动、CUDA、cuDNN安装:

Ubuntu安装NVIDIA套件:驱动、CUDA、cuDNN - 知乎 (zhihu.com)

4090安装cuda11.8记录_cuda 11.8 显卡-CSDN博客

anaconda安装: 

ubuntu安装anaconda并解决环境变量冲突问题 - 知乎 (zhihu.com)

在ubuntu 22.04 系统中搭建 anaconda环境 安装 jupyter notebook_ubuntu22 anaconda3-CSDN博客

pytorch安装:

安装pytorch时用wheel和用conda安装有什么区别? - 知乎 (zhihu.com)

【机器学习】PyTorch、Cuda 的安装和示例代码_pytorch cuda-CSDN博客

【conda】利用Conda创建虚拟环境,Pytorch各版本安装教程(Ubuntu)_ubuntu在conda环境安装torch教程-CSDN博客(添加镜像)

posted @ 2024-05-22 21:25  听风不成泣  阅读(1131)  评论(0编辑  收藏  举报