显卡驱动+cuda+cudnn+深度学习框架
安装概览
安装显卡驱动、CUDA 和 cuDNN 可能因操作系统和 GPU 型号而异,下面是一般的步骤:
- 下载和安装适合你 GPU 型号的显卡驱动,可以从官方网站或者 GPU 制造商的网站下载。
- 下载和安装适合你 CUDA 版本的 CUDA 工具包,可以从官方网站下载。
- 下载和安装适合你 CUDA 版本的 cuDNN 库,可以从 NVIDIA Developer 网站下载。
- 配置环境变量,以便你的系统能够找到 CUDA 和 cuDNN 的库文件。
注意:显卡、驱动、CUDA、cuDNN、Python和深度学习环境(TensorFlow等)都要匹配
尤其是 TensorFlow1.0 和 2.0 的使用对显卡等版本要求严格。
例如:GTX 1050 + CUDA10.1 + python3.8 + tensorflow2.3.0
1. 安装驱动
不同操作系统和显卡型号需要使用不同的命令来安装显卡驱动,下面是几个常见的操作系统的命令:
1.1 Windows
在 Windows 系统中,你可以通过官方网站下载适合你显卡型号的驱动程序,然后运行 .exe 文件进行安装。在安装过程中,你可以根据提示选择“自定义安装”选项来选择需要安装的组件。
1.2 Ubuntu
在 Ubuntu 中,你可以使用 ubuntu-drivers
命令来自动安装显卡驱动程序。这个命令是 Ubuntu 提供的官方工具,用于识别和安装适用于硬件的推荐和建议驱动程序。
首先,你需要更新软件包列表和已安装软件包的版本:
sudo apt update
sudo apt upgrade
然后,安装 ubuntu-drivers
命令行工具:
sudo apt install ubuntu-drivers-common
接下来,你可以运行下面的命令来获取可以使用的所有驱动程序的列表:
sudo ubuntu-drivers list
然后,你可以使用下面的命令来安装推荐的驱动程序:
sudo ubuntu-drivers autoinstall
# 或者
sudo apt install nvidia-driver-470
需要注意的是,
ubuntu-drivers
命令不会安装 NVIDIA CUDA 和 cuDNN 等其他必需的组件,你需要另外安装它们来进行深度学习开发。
最后输入 nvidia-smi
查看是否安装成功。(所有系统通用命令)
nvidia-smi
1.3 MacOS
在 MacOS 系统中,你可以通过以下步骤来安装显卡驱动:
- 检查系统中是否安装了其他版本的显卡驱动,可以使用以下命令来查看:
kextstat | grep -i "nvidia"
如果输出了 NVIDIA 的信息,说明系统中已经安装了显卡驱动。
-
下载适合你显卡型号和 MacOS 版本的显卡驱动,可以从NVIDIA官方网站下载。
-
双击下载的 .dmg 文件,然后按照提示进行操作,通常会要求你输入管理员密码。
-
安装完成后,重启系统即可。
2. 安装cuda
windows 无脑装.exe,同样不要安装驱动,主要介绍 Ubuntu 的安装
首先在 Nvidia 官网下载适合自己机器的 CUDA 版本,官网下载,使用 runfile
的方式安装
可以直接将网址复制到浏览器下载,或者命令行 wget 下载
接着输入安装命令,按照指示即可
sudo sh cuda_*.run
如果电脑没有安装Nvidia显卡驱动,安装会顺利进行;若已经安装了Nvidia驱动,会提醒移除可以选择Abort退出,之后去删除驱动,也可以直接继续Continue,我选择Continue
选择accpet接受协议
取消勾选第一个driver,直接回车就能取消前面的[X],然后install
根据提示的信息,配置环境变量
sudo vi ~/.bashrc
export CUDA_HOME=/usr/local/cuda-11.3
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
然后刷新环境变量
source ~/.bashrc
测试CUDA是否安装成功
nvcc -V
显示下图,说明成功
3. 安装cuDNN
下载cuDNN ,官网(未注册的话,注册一个账号即可)
解压复制到 cuda 路径下
tar -zxvf cudnn*
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
安装deb
sudo dpkg -i libcudnn8_8.0.5.39-1+cuda11.0_amd64.deb
sudo dpkg -i libcudnn8-dev_8.0.5.39-1+cuda11.0_amd64.deb
sudo dpkg -i libcudnn8-samples_8.0.5.39-1+cuda11.0_amd64.deb
测试
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
结果为PASS就成功了。
sudo make clean #洁癖患者请清除编译
4. 安装深度学习框架
- 查看
Pytorch
官网 https://pytorch.org/
# 安装 cuda=11.3 专属 pytorch
conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
- 查看
Tensorflow
官网 https://www.tensorflow.org/
# GPU 版本
pip install tensorflow-gpu==2.3.0
# CPU 版本
pip install tensorflow==2.3.0