参考:常用nvidia-smi命令详解(最新推荐)
-
nvidia-smi
: 显示当前系统上Nvidia GPU的状态,包括设备的使用情况、显存使用情况、功耗等信息。使用该命令可以查看GPU的状态,例如GPU的使用率、显存占用率、功耗等信息,以及GPU的温度、风扇转速等参数。


nvidia-smi -l 1
:间隔1秒刷新GPU信息
nvidia-smi -l
:间隔几秒刷新GPU信息
-
nvidia-smi -L
: 显示当前系统上所有Nvidia GPU设备的信息。使用该命令可以查看当前系统上所有的Nvidia GPU设备的信息,包括设备的名称、索引、总显存大小等。


-
nvidia-smi dmon
: 显示GPU设备的显存使用情况和GPU的繁忙度。使用该命令可以实时监测GPU的显存使用情况和GPU的繁忙度,并以文本形式输出。

-
nvidia-smi -q
: 显示GPU的详细信息,包括硬件规格、驱动版本、显存信息、功耗管理、温度控制、GPU拓扑结构等信息。使用该命令可以了解GPU的硬件配置、驱动版本、显存大小、功耗管理策略、温度控制策略等信息,以及GPU的连接关系、拓扑结构等信息。
-
nvidia-smi -i [device_index] -q
: 显示指定GPU设备的详细信息。使用该命令可以查看指定GPU设备的详细信息,例如该设备的硬件规格、驱动版本、显存信息、功耗管理、温度控制等信息。
-
nvidia-smi --query-gpu=name,temperature.gpu,utilization.gpu,memory.total,memory.used,memory.free --format=csv
: 显示当前系统上所有Nvidia GPU设备的使用情况,并输出到CSV文件中,方便后续分析。使用该命令可以显示当前系统上所有Nvidia GPU设备的使用情况,例如GPU的温度、利用率、显存使用情况等信息,并将信息输出到CSV文件中,方便后续分析。
-
nvidia-settings
: 显示GPU设备的详细配置信息,包括显卡型号、GPU核心时钟、内存时钟、电压等信息。使用该命令可以配置GPU设备的参数,例如GPU的核心时钟、内存时钟、电压等参数。
-
nvidia-smi -i [device_index] -e 0x20
: 显示指定GPU设备的ECC错误日志。使用该命令可以查看指定GPU设备的ECC错误日志,以帮助排查硬件问题。
-
nvidia-smi topo -m
: 显示GPU拓扑结构和连接关系,可用于识别GPU间连接的带宽和延迟等信息。使用该命令可以了解GPU设备之间的连接关系和拓扑结构,以及GPU设备之间的带宽和延迟等信息。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)