ubuntu-CUDA 开发环境搭建
CUDA 开发环境搭建
1. 安装 CUDA ToolKit
- 查询驱动支持的CUDA版本
# 命令输出第一行版本nvidia-smi命令的版本,nvidia驱动版本与支持的cuda版本,当前本地机器支持的cuda版本为12.2
nvidia-smi
- 进入官网下载对应版本的cuda安装,历史版本归档下载链接:https://developer.nvidia.com/cuda-toolkit-archive
1. 选择操作系统平台 > CPU架构 > 操作系统 > 分发版本 > 安装方式
如: linux > x86_64 > ubuntu > 22.04 > runfile(local)
- 安装
mkdir -p ~/apps/download && cd $_
wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run
sudo sh cuda_12.2.2_535.104.05_linux.run
# 安装过程中,驱动已经存在了,选择继续安装,然后接受协议,在安装选项界面,使用空格去掉驱动安装的选择,然后选择安装即可
- 安装输出:包含安装路径、后续配置项、如何卸载、安装驱动命令、日志文件路径
===========
= Summary =
===========
Driver: Not Selected
Toolkit: Installed in /usr/local/cuda-12.2/
Please make sure that
- PATH includes /usr/local/cuda-12.2/bin
- LD_LIBRARY_PATH includes /usr/local/cuda-12.2/lib64, or, add /usr/local/cuda-12.2/lib64 to /etc/ld.so.conf and run ldconfig as root
To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-12.2/bin
***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 535.00 is required for CUDA 12.2 functionality to work.
To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:
sudo <CudaInstaller>.run --silent --driver
Logfile is /var/log/cuda-installer.log
- 配置:
~/.bashrc
# CUDA ToolKit
export PATH=$PATH:/usr/local/cuda-12.2/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-12.2/lib64
- 检查版本
# 新建终端,输出
nvcc --version
2. 安装 CuDNN
一般需要配置机器学习框架某个版本所要求的CuDNN版本与CUDA ToolKit支持的CuDNN版本,两个信息共同确认
- PyTorch要求文档:https://github.com/pytorch/pytorch?tab=readme-ov-file#from-source
- CuDNN下载链接:https://developer.nvidia.com/rdp/cudnn-archive
- 本地机器的CUDA版本为12.x系列,PyTorch要求的版本在8.5以上,安装最新的支持版本CuDNN-8.9.7
# CuDNN下载需要登录nvidia官网,注册账号并登录
# 选择 linux类别下Ubuntu对应版本与架构的deb安装包下载即可
sudo dkpg -i cudnn-local-repo-ubuntu2204-8.9.7.29_1.0-1_amd64.deb
# 拷贝本地cudnn源公钥
cp /var/cudnn-local-repo-ubuntu2204-8.9.7.29/cudnn-local-08A7D361-keyring.gpg /usr/share/keyrings/
# 安装示例
sudo apt install -y libcudnn8-samples
# 查找示例安装目录
find / -name cudnn_samples* -type d
# 进入示例目录
cd /usr/src/cudnn_samples_v8/mnistCUDNN/
# 安装编译依赖
sudo apt install -y libfreeimage3 libfreeimage-dev
# 编译并执行
make clean && make
# 执行以下程序,若输出Test passed!则cudnn成功安装并运行
./mnistCUDNN
# 若执行过程中发现gcc版本过高或者过低,则重新安装gcc
sudo apt remove gcc
sudo apt install gcc-12 g++-12 -y
sudo ln -s /usr/bin/gcc-12 /usr/bin/gcc
sudo ln -s /usr/bin/g++-12 /usr/bin/g++
sudo ln -s /usr/bin/gcc-12 /usr/bin/cc
sudo ln -s /usr/bin/g++-12 /usr/bin/c++