【CUDA基础】nvidia-smi命令解析

命令行

xxx@1604:~$ nvidia-smi
Mon Aug  2 19:46:53 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 430.64       Driver Version: 430.64       CUDA Version: 10.1     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 108...  Off  | 00000000:81:00.0  On |                  N/A |
| 23%   34C    P8     9W / 250W |    333MiB / 11178MiB |      2%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      5918      G   /usr/lib/xorg/Xorg                           144MiB |
|    0      6530      G   compiz                                       185MiB |
+-----------------------------------------------------------------------------+

第一行:表示驱动的版本,以及驱动可以使用的CUDA的最高版本;

nvidia-smi命令解析

第一栏的Fan:N/A是风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温(比如我们实验室的服务器是常年放在空调房间里的)。
第二栏的Temp:是温度,单位摄氏度。
第三栏的Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
第四栏下方的Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
第五栏的Bus-Id是涉及GPU总线的东西,domain?device.function
第六栏的Disp.A是Display Active,表示GPU的显示是否初始化。
第五第六栏下方的Memory Usage是显存使用率。
第七栏是浮动的GPU利用率。
第八栏上方是关于ECC的东西。
第八栏下方Compute M是计算模式。

一般情况下,主机系统会安装一个较高版本的CUDA,然后不同的虚拟环境可以安装不高于主机系统的CUDA版本;

虚拟机的显卡是虚拟的,不能使用CUDA;

nvidia-smi是基于独立的GPU驱动架构的,而Jetson是基于集成的GPU驱动的,故Jetson不支持nvidia-smi。

NVML and nvidia-smi are one in the same (nvidia-smi uses NVML library to get it’s info). Since NVML is based on discrete GPU driver architecture, it isn’t supported on Jetson which uses integrated GPU driver.

If you want to check GPU utilization, please use tegrastats.

sudo ./tegrastats

 

 

参考

1. 对于Jetson TX2新手几个常见问题

posted on 2019-10-16 10:28  鹅要长大  阅读(958)  评论(0编辑  收藏  举报

导航