nvidia-smi-NVIDIASystemManagementInterfaceprogram
nvidiasmi(也称为NVSMI)为来自Fermi和更高体系结构系列的nvidiaTesla、Quadro、GRID和GeForce设备提供监控和管理功能。GeForceTitan系列设备支持大多数功能,为GeForce品牌的其余部分提供的信息非常有限。NVSMI是一种跨平台工具,支持所有标准NVIDIA驱动程序支持的Linux发行版,以及从WindowsServer2008R2开始的64位版本的Windows。
NVIDIA系統管理介面(nvidia-smi)是一個命令行工具,基於NVIDIAManagementLibrary(NVML)之勝,旨在協助管理和監控NVIDIAGPU設備。
此实用程序允许管理员查询GPU设备状态,并允许管理员使用适当的权限修改GPU设备状态。它针对Tesla,GRID,Quadro和TitanX产品,但其他NVIDIAGPU也提供有限的支持。
NVIDIA-smi在Linux上附带NVIDIAGPU显示驱动程序,以及64位WindowsServer2008R2和Windows7。Nvidia-smi可以将查询信息报告为XML或人类可读的纯文本到标准输出或文件。
常用nvidia-smi命令显示GPU所有信息
nvidia-smi
间隔1秒刷新GPU信息
nvidia-smi-l1
列出当前所有GPU设备
nvidia-smi-L
查看当前的GPU时钟速度、默认时钟速度和最大可能的时钟速度
nvidia-smi-q-dCLOCK
PS:
直接在命令行输入命令应该是各位炼丹师再熟悉不过的命令了。
注意:建议使用来动态地观察GPU的状态。
通过nvidia-smi命令,我们会得到这样一个信息丰富的页面:
TueNov913:47:512021+-----------------------------------------------------------------------------+|NVIDIA-SMI495.44DriverVersion:495.44CUDAVersion:11.5||-------------------------------+----------------------+----------------------+|GPUNamePersistence-M|Bus-IdDisp.A|VolatileUncorr.ECC||FanTempPerfPwr:Usage/Cap|Memory-Usage|GPU-UtilComputeM.||||MIGM.||===============================+======================+======================||0NVIDIAGeForce...Off|00000000:17:00.0Off|N/A||62%78CP2155W/170W|10123MiB/12051MiB|100%Default||||N/A|+-------------------------------+----------------------+----------------------+|1NVIDIAGeForce...Off|00000000:65:00.0Off|N/A||100%92CP2136W/170W|10121MiB/12053MiB|99%Default||||N/A|+-------------------------------+----------------------+----------------------+|2NVIDIAGeForce...Off|00000000:B5:00.0Off|N/A||32%34CP812W/170W|5MiB/12053MiB|0%Default||||N/A|+-------------------------------+----------------------+----------------------+|3NVIDIAGeForce...Off|00000000:B6:00.0Off|N/A||30%37CP813W/170W|5MiB/12053MiB|0%Default||||N/A|+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+|Processes:||GPUGICIPIDTypeProcessnameGPUMemory||IDIDUsage||=============================================================================||0N/AN/A1258G/usr/lib/xorg/Xorg6MiB||0N/AN/A10426C...a3/envs/JJ_env/bin/python10111MiB||1N/AN/A1258G/usr/lib/xorg/Xorg4MiB||1N/AN/A10427C...a3/envs/JJ_env/bin/python10111MiB||2N/AN/A1258G/usr/lib/xorg/Xorg4MiB||3N/AN/A1258G/usr/lib/xorg/Xorg4MiB|+-----------------------------------------------------------------------------+

可以看到其中各个位置的对应含义在输出本身中其实都已经指出了(蓝框),红框则指出了输出各个部分的含义,大部分输出的作用一目了然,这里笔者将其中几个不那么直观的参数简单整理一下:
Fan:从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。
Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
Disp.A:DisplayActive,表示GPU的显示是否初始化。
VolatileUncorr.ECC:是否开启ECC纠错。
type:进程类型。C表示计算进程,G表示图形进程,C+G表示都有。
除了直接运行命令之外,还可以加一些参数,来查看一些本机NvidiaGPU的其他一些状态。下面笔者简单介绍几个常用的参数,其他的有需要可以去手册中查找:。
参数显示连接到系统的GPU列表。
GPU0:NVIDIAGeForceRTX3060(UUID:GPU-55275dff-****-****-****-6408855fced9)
GPU1:NVIDIAGeForceRTX3060(UUID:GPU-0a1e7f37-****-****-****-df9a8bce6d6b)
GPU2:NVIDIAGeForceRTX3060(UUID:GPU-38e2771e-****-****-****-d5cbb85c58d8)
GPU3:NVIDIAGeForceRTX3060(UUID:GPU-8b45b004-****-****-****-46c05975a9f0)
:此值是GPU的全球唯一不可变字母数字标识符。它与主板上的物理标签无关。
参数指定某个GPU,多用于查看GPU信息时指定其中一个GPU。
参数查看GPU的全部信息。可通过参数指定查看某个GPU的参数。
nvidia-smi-i0-q
输出太长了,笔者这里就不列了,大家可以自己试一下,是很完整的信息。
展示多GPU系统的拓扑连接信息,通常配合参数即,其他参数可自行查阅。
输出如下,这里用代码块没法对齐,就直接贴图了:
以上就是Linux常用nvidia-smi命令有哪些的详细内容,更多请关注主机测评网其它相关文章!
本文来源:国外服务器--Linux常用nvidiasmi命令有哪些(linux系统nvidia显卡设置)
本文地址:https://www.idcbaba.com/guowai/5120.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 1919100645@qq.com 举报,一经查实,本站将立刻删除。



