排查服务器上占用 GPU 资源的进程信息

排查服务器上占用 GPU 资源的进程信息,第1张

1、使用命令 nvidia-smi 查询简单的进程信息

2、使用命令 ll /proc/PID 查询详细的进程信息

3、查询 PID 对应的容器 - Docker Container

Linux查看显卡信息:

[python] view plain copy

lspci | grep -i vga  

使用nvidia GPU可以:

[python] view plain copy

lspci | grep -i nvidia  

前边的序号 "00:0f.0"是显卡的代号(这里是用的虚拟机)

查看指定显卡的详细信息用以下指令:

[python] view plain copy

lspci -v -s 00:0f.0  

Linux查看Nvidia显卡信息及使用情况

Nvidia自带一个命令行工具可以查看显存的使用情况:

[python] view plain copy

nvidia-smi  

表头释义: 

Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A; 

Temp:显卡内部的温度,单位是摄氏度;

Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;

Pwr:能耗表示; 

Bus-Id:涉及GPU总线的相关信息; 

Disp.A:是Display Active的意思,表示GPU的显示是否初始化; 

Memory Usage:显存的使用率; 

Volatile GPU-Util:浮动的GPU利用率;

Compute M:计算模式; 

下边的Processes显示每块GPU上每个进程所使用的显存情况。

如果要周期性的输出显卡的使用情况,可以用watch指令实现:

[python] view plain copy

watch -n 10 nvidia-smi  

命令行参数-n后边跟的是执行命令的周期,以s为单位。

查看电脑的GPU和VRAM方法如下:

1、打开程序找到并选择设备管理器。

2、在设备管理器中找到显示适配器。

3、点击显示适配器就可以看到电脑的GPU和VRAM选项。

4、双击查看GPU和VRAM的详细常规信息。

5、点击上方菜单栏则可以看到更多GPU和VRAM的详细信息。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/764047.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-19
下一篇2023-08-19

发表评论

登录后才能评论

评论列表(0条)

    保存