GPU服务研究学习...
windows10 版本安装 CUDA ,首先需要下载两个安装包
CUDA toolkit(toolkit就是指工具包)
cuDNN
# 安装CUDA
https://developer.nvidia.com/cuda-downloads
# 安装cuDNN
https://developer.nvidia.com/cudnn
软件包安装(zip) 在以下步骤中,“<packagepath>”表示软件包目录路径进入包含cuDNN软件包的<packagepath>目录。 # 解压缩cuDNN软件包。 cudnn-windows-x86_64--archive.zip # 从解压缩的软件包中复制以下文件到NVIDIA cuDNN目录中。 将bin\cudnn.dll复制到C:\Program Files\NVIDIA\CUDNN\v8.x\bin 将include\cudnn*.h复制到C:\Program Files\NVIDIA\CUDNN\v8.x\include 将lib\cudnn*.lib复制到C:\Program Files\NVIDIA\CUDNN\v8.x\lib
设置以下环境变量以指向cuDNN所在的位置。要访问“$(PATH)”环境变量的值,请执行以下步骤: 从“开始”菜单中打开命令提示符,输入“运行”,然后按Enter键 发出“控制sysdm.cpl”命令 在窗口的顶部选择“高级”选项卡。 在窗口底部单击“环境变量”。 将NVIDIA cuDNN bin目录路径添加到PATH变量中: 变量名称:PATH 添加的值:C:\Program Files\NVIDIA\CUDNN\v8.x\bin
安装完毕后验证
# 查看Cuda版本
nvcc --version
# 查看GPU使用情况
nvidia-smi
字段名 | 值 | 描述 |
---|---|---|
Fan | 风扇转速 (0%--100%) | 风扇转速各适量,N/A 表示没有风扇 |
Temp | GPU 温度 (GPU 温度过高会导致 GPU 频率下降) | GPU 温度各适量,过高的温度可能导致 GPU 性能下降 |
Perf | 性能状态 (从 P0(最大性能) 到 P12(最小性能)) | GPU 性能状态各适量,P0 表示最大性能,P12 表示最小性能 |
Pwr | GPU 功耗 | GPU 功耗各适量,越高的功耗表示更高的性能 |
Persistence-M | 持续模式的状态 (持续模式耗能大,但在新的 GPU 应用启动时花费时间更少) | 持续模式状态各适量,持续模式会提高 GPU 的启动速度 |
Bus-Id | GPU 总线 (domain:bus:device.function) | GPU 总线 ID 各适量,用于确定 GPU 的总线关联 |
Disp.A | Display Active | GPU 显示是否初始化,为 1 表示 GPU 已初始化 |
Memory-Usage | 显存使用率 | 显存使用率各适量,越高的使用率表示 GPU 需要更多的显存资源 |
Volatile GPU-Util | GPU 使用率 | GPU 使用率各适量,越高的使用率表示 GPU 性能越好 |
ECC | 是否开启错误检查和纠正技术,0/DISABLED, 1/ENABLED | 是否开启错误检查和纠正技术,0 表示禁用,1 表示启用 |
Compute M. | 计算模式 (0/DEFAULT,1/EXCLUSIVE_PROCESS,2/PROHIBITED) | 计算模式各适量,0 表示 DEFAULT,1 表示 EXCLUSIVE_PROCESS,2 表示 PROHIBITED |
#查看 CUDA 设置的环境变量
set cuda
# 列出所有可用的 NVIDIA 设备信息
nvidia-smi -L
# 定时刷新,1秒1次
nvidia-smi dmon
# 监控应用对GPU的使用率,1秒1次
nvidia-smi pmon
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?