Ubuntu20.04安装CUDA
一、安装显卡驱动
https://www.cnblogs.com/chenjian688/p/16202512.html
安装成功后的结果如下
新系统安装完nvidia驱动后是不会自动安装cuda的,一定自己一步一步安装。
如果想确认自己没有安装,运行如下命令查询即可。
nvcc -V
如果安装,并在.bashrc中写入过环境变量,会出现如下结果。
否则会出现如下结果
Command 'nvcc' not found, but can be installed with:
sudo apt install nvidia-cuda-toolkit
不要使用包管理器安装。
二、安装CUDA
1、下载安装包
https://developer.nvidia.com/cuda-toolkit-archive
下载的版本不要超过nvidia-smi中显示的版本。
样例选择如下,请按照自己的系统选择
如上图安装指令,安装过程中会让你选择
移动到Driver选项上,按空格键将该项取消。移动到Install选项,回车,等待安装完成。
2、配置环境变量
vim ~/.bashrc
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
使用nvcc -V测试是否安装成功
3、多版本切换
cuda默认安装在了/usr/local下
我们安装的是11.7版本,图中的cuda文件夹是cuda-11.7的软连接
当想要使用cuda其他版本时,删除当前软链接,新建cuda的软链接即可。
三、安装NCCL
NCCL是一个针对多GPU并行计算优化的通信库
#cuda11.7 使用2.18,cuda9.2使用2.3.7.1
git clone -b v2.3.7-1 --depth 1 https://github.com/NVIDIA/nccl.git
cd nccl
make -j8 src.build CUDA_HOME=/usr/local/cuda