

显示 说明
Fan 风扇转速(0%--100%),N/A表示没有风扇
Temp GPU温度(GPU温度过高会导致GPU频率下降)
Perf 性能状态,从P0(最大性能)到P12(最小性能)
Pwr GPU功耗
Persistence-M 持续模式的状态(持续模式耗能大,但在新的GPU应用启动时花费时间更少)
Bus-Id GPU总线,domaindevice.function
Disp.A Display Active,表示GPU的显示是否初始化
Memory-Usage 显存使用率
Volatile GPU-Util GPU使用率
ECC 是否开启错误检查和纠正技术,0/DISABLED, 1/ENABLED
附加选项 说明
nvidia-smi -i xxx 指定某个GPU
nvidia-smi -l xxx 动态刷新信息(默认5s刷新一次)
nvidia-smi –f xxx 将查询的信息输出到具体的文件中,不在终端显示

nvidia-smi -q


命令 说明
nvidia-smi –q –u 显示单元而不是GPU的属性
nvidia-smi –q –i xxx 指定具体的GPU或unit信息
nvidia-smi –q –f xxx 将查询的信息输出到具体的文件中,不在终端显示
nvidia-smi –q –x 将查询的信息以xml的形式输出
nvidia-smi –q –l xxx 动态刷新信息,按Ctrl+C停止,可指定刷新频率,以秒为单位
nvidia-smi --query-gpu=gpu_name,gpu_bus_id,vbios_version--format=csv 选择性查询选项,可以指定显示的属性选项。可查看的属性有:timestamp,driver_version,pci.bus,pcie.link.width.current等。(可查看nvidia-smi--help-query–gpu来查看有哪些属性)



命令 说明
nvidia-smi –pm 0/1 设置持久模式:0/DISABLED,1/ENABLED
nvidia-smi –e 0/1 切换ECC支持:0/DISABLED, 1/ENABLED
nvidia-smi –p 0/1 重置ECC错误计数:0/VOLATILE, 1/AGGREGATE
nvidia-smi –r GPU复位
nvidia-smi –vm 设置GPU虚拟化模式
nvidia-smi –ac xxx,xxx 设置GPU运行的工作频率。e.g. nvidia-smi –ac2000,800
nvidia-smi –rac 将时钟频率重置为默认值
nvidia-smi –acp 0/1 切换-ac和-rac的权限要求,0/UNRESTRICTED, 1/RESTRICTED
nvidia-smi –pl 指定最大电源管理限制(瓦特)
nvidia-smi –am 0/1 启用或禁用计数模式,0/DISABLED,1/ENABLED
nvidia-smi –caa 清除缓冲区中的所有已记录PID,0/DISABLED,1/ENABLED

nvidia-smi dmon


GPU统计信息以一行的滚动格式显示,要监控的指标可以基于终端窗口的宽度进行调整。 监控最多4个GPU,如果没有指定任何GPU,则默认监控GPU0-GPU3(GPU索引从0开始)。

命令 说明
nvidia-smi dmon –i xxx 用逗号分隔GPU索引,PCI总线ID或UUID
nvidia-smi dmon –d xxx 指定刷新时间(默认为1秒)
nvidia-smi dmon –c xxx 显示指定数目的统计信息并退出
nvidia-smi dmon –o D/T 指定显示的时间格式D:YYYYMMDD,THH:MM:SS
nvidia-smi dmon –f xxx 将查询的信息输出到具体的文件中,不在终端显示
nvidia-smi dmon –s xxx 指定显示哪些监控指标(默认为puc),其中:

nvidia-smi pmon


GPU进程统计信息以一行的滚动格式显示,此工具列出了GPU所有进程的统计信息。要监控的指标可以基于终端窗口的宽度进行调整。 监控最多4个GPU,如果没有指定任何GPU,则默认监控GPU0-GPU3(GPU索引从0开始)。

命令 说明
nvidia-smi pmon –i xxx 用逗号分隔GPU索引,PCI总线ID或UUID
nvidia-smi pmon –d xxx 指定刷新时间(默认为1秒,最大为10秒)
nvidia-smi pmon –c xxx 显示指定数目的统计信息并退出
nvidia-smi pmon –o D/T 指定显示的时间格式D:YYYYMMDD,THH:MM:SS
nvidia-smi pmon –f xxx 将查询的信息输出到具体的文件中,不在终端显示
nvidia-smi pmon –s xxx 指定显示哪些监控指标(默认为u),其中:

