ubuntu 22.04 深度学习环境配置(pytorch版本)| cuda、nvidia-driver、cudnn

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
本贴已经作废,请看新帖子-https://www.cnblogs.com/lycnight/p/17777713.html
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

别再往下看了,本贴已经作废,请看新帖子!
别再往下看了,本贴已经作废,请看新帖子!
别再往下看了,本贴已经作废,请看新帖子!
别再往下看了,本贴已经作废,请看新帖子!
别再往下看了,本贴已经作废,请看新帖子!
别再往下看了,本贴已经作废,请看新帖子!
别再往下看了,本贴已经作废,请看新帖子!
别再往下看了,本贴已经作废,请看新帖子!
别再往下看了,本贴已经作废,请看新帖子!

参考博客:
https://zhuanlan.zhihu.com/p/94334567
https://zhuanlan.zhihu.com/p/523282507


part1 验证方法

1 验证Anaconda

conda -V

2 验证显卡驱动

nvidia-smi

3 验证cuda

nvcc -V

4 验证cuDNN

cat /usr/local/cuda-12.1/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

5 验证pytorch、torchvision、torchaudio、pytorch-cuda

conda list | grep torch

然后进入相应的虚拟环境,用python验证:

import torch
print(torch.cuda.is_available())
# print(torch.__version__)
# print(torch.version.cuda)

如果机器上有GPU,那么不出意外的话将输出true


part2 安装顺序

1 装Anaconda、搞虚拟环境

conda create --name pku
conda create --name d2l-zh python=3.10

激活虚拟环境

conda activate chatglm_env

退出虚拟环境

conda deactivate

显示虚拟环境列表

conda info --env

2 装显卡驱动

上网搜教程,记得先关闭noveau驱动再安装Nvidia驱动
nvidia-driver下载官网
我当时(2023.8)安装的版本:
image
image

注意,成功安装完nvidia-driver后运行nvidia-smi也能看到一个cuda版本,这是正常的。我们要用的cuda是接下来要安装的cuda,不是driver自带的这个。关于为什么会有两个cuda:https://zhuanlan.zhihu.com/p/523282507

image

(其实这个问题有一个避免方式,就是直接先安装cuda toolkit,然后会自带nvidia-sriver,这样的话 nvidia-smi 和 nvcc -V 的cuda版本就会一致了)

问题还没结束,我到底要以哪个cuda为准呢?
参考:https://www.jianshu.com/p/eb5335708f2a


3 装cuda toolkit

关于 cuda 和 nvidia-dirver版本的兼容关系
image

image

image

image

关于最低driver版本的兼容性:https://docs.nvidia.com/deploy/cuda-compatibility/
即:可以使用较低版本的driver来运行cuda,但是会有一些功能受限
image
image

上cuda官网下载cuda toolkit:https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=22.04&target_type=deb_network
(这个时候是2023.8,所以这个网页打开是下载的cuda 12.2)
image
image

但是安装cuda toolkit的时候有一步:

image

image
image

记得选NO,否则会把之前的 nvidia-driver版本(535.98)覆盖成了cuda 12.2自带的nvidia-driver版本
(TMD,后来ubuntu自动更新功能把我的驱动更新了
image


4 装cudnn

(2023.8)
还没搞,貌似是上官网(这里需要账号)安装文档安装即可
https://developer.nvidia.com/cudnn
(不过我没装cudnn也能跑深度学习)

(2023.10.16更新)
尝试安装 cudnn,成功。
附一个本人的cudnn安装过程记录
参考:cuda和cudnn的版本对应关系
cuda,cudnn版本对应官网(https://developer.nvidia.com/rdp/cudnn-archive)

5 装pytorch、torchvision...

附一个本人的pytorch安装过程记录

posted @ 2023-08-10 14:55  zz子木zz  阅读(420)  评论(0编辑  收藏  举报