重新安装CUDA+CUDNN+PyTorch路上遇到的问题

书接上回,因为CUDA和CUDNN突然用不了了,被迫卸载重新下载。

删除的教程参考的是https://blog.csdn.net/m0_53883779/article/details/135701971。在控制面版卸载中,其实可以留意一下NVIDIA相关软件的安装日期,很快也就分辨出来了,因为我并不是一天把所有的软件都装好了。我这里还有一个NVIDIA USBC Driver,看着安装日期和基础的软件安装日期相同,也没有卸载。来到安装目录,把NVIDIA GPU Computing Toolkit文件夹删除,再用火绒清理一下垃圾,这里卸载就算完成了。

安装的话,按照自己的需求,选择CUDA11.8版本,下载地址:https://developer.nvidia.com/cuda-toolkit-archive。下载完成后,点安装即可,在安装的过程中选择自定义安装,在自定义安装项中,点开CUDA一栏,将Visual Studio Intergration取消,因为我没安装Visual Studio。我按照这个做法很顺利的安装完成了。

安装完后对安装的效果进行检查与验证。查看系统的环境变量,是否生成两个新的系统变量CUDA_PATH和CUDA_PATH_V11_8。打开cmd,输入指令:nvcc --version,查看是否出现CUDA的版本信息。

现在安装CUDNN。首先得注册一个账号,注册的地址:https://developer.nvidia.com/rdp/cudnn-download,页面右上角。找需要的版本地址:https://developer.nvidia.com/rdp/cudnn-archive。下载完成后,解压出来会有bin,include,lib三个文件夹,把他们以管理员身份复制到CUDA的安装目录,我这里是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8

安装好以后,打开系统的环境变量,在PATH中添加以下的路径:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\binC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\includeC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\libC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\libnvvp

添加完成后打开cmd,输入指令:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\extras\demo_suite,分别输入 bandwidthTest.exedeviceQuery.exe ,如果能看到两个PASS,那就算是装好了。

接下来就是最痛苦的一集,装PyTorch。官方地址:https://pytorch.org/get-started/locally/。在上面可以选择符合你设备当前环境的选项,最后会给你显示一个下载命令。一开始我真的以为是这么简单,直接就切换到项目的虚拟环境里面开始运行了,然后这个下载速度令我眉头紧皱,2.5GB的文件正在以100+Kb的速度下载,我真的要裂开了。果断停下来,开一个代理,然后发现用代理下载会被SSL拒绝。没办法,我寻思就这么下吧,好像也不是那么急,过了二十分钟回来一看,连接中断了,我是真的挺无语的,看来又是一番鏖战。

期间去查了很多的方法,发现有很多的方法是在conda的环境下可以运行的,比如说在conda的环境下可以在https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/找到自己所需要的文件,下载完成后直接conda install就完成了。对于上述的方法我试过pip命令运行不了,突然有点羡慕conda。

现在说一说成功的办法,到官方存放资源的网站中去https://download.pytorch.org/whl/torch_stable.html,找到自己所需要的版本。文件名需要看清楚,cu118是CUDA的版本,torch的数字为torch的版本,cp39代表Pyhton3.9,一定要下载对应的torch版本。这里直接下载还是很慢,但是可以用代理,很快就下载好了。用同样的方法也下载好了torchvision,torch和torchvision的对应版本参考以下链接:https://github.com/pytorch/vision

下载完成后安装,转移到虚拟环境中,输入指令:pip install "文件所在的地址\torch-2.3.1+cu118-cp39-cp39-win_amd64.whl",注意这个双引号是一定要的。如果没有挂代理的话,这里要加上镜像的地址,不然下载还是会很慢,当时应该是一直开着代理所以速度快。安装完成后进行验证,在虚拟环境中进入Python,输入指令:

点击查看代码
import torch
torch.cuda.is_available()
若返回的结果是True,则证明安装成功了。提醒一下,如果这里还没有安装ultralytics,那还是要先安装这个,因为用国内的镜像会默认装最新版本cpu版本的torch,安装的过程中会卸载cuda版本的torch和torchvision。这边新装环境的时候没注意,导致又重新装了一遍cuda版本的torch。

经历了好一阵子的折腾,终于装好了,当我很高兴的准备模型训练时,不出意外就要出意外了,得闲再说。

posted @   fffuzera  阅读(174)  评论(1编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示