Linux服务器如何查看GPU信息

Linux服务器如何查看GPU信息,第1张

Linux查看显卡信息:

[python] view plain copy

lspci | grep -i vga  

使用nvidia GPU可以:

[python] view plain copy

lspci | grep -i nvidia  

前边的序号 "00:0f.0"是显卡的代号(这里是用的虚拟机)

查看指定显卡的详细信息用以下指令:

[python] view plain copy

lspci -v -s 00:0f.0  

Linux查看Nvidia显卡信息及使用情况

Nvidia自带一个命令行工具可以查看显存的使用情况:

[python] view plain copy

nvidia-smi  

表头释义: 

Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A; 

Temp:显卡内部的温度,单位是摄氏度;

Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;

Pwr:能耗表示; 

Bus-Id:涉及GPU总线的相关信息; 

Disp.A:是Display Active的意思,表示GPU的显示是否初始化; 

Memory Usage:显存的使用率; 

Volatile GPU-Util:浮动的GPU利用率;

Compute M:计算模式; 

下边的Processes显示每块GPU上每个进程所使用的显存情况

如果要周期性的输出显卡的使用情况,可以用watch指令实现:

[python] view plain copy

watch -n 10 nvidia-smi  

命令行参数-n后边跟的是执行命令的周期,以s为单位。

开机自检是指接通电源后计算机首先自动运行主板BIOS芯片里固化的程序并对各个硬件进行检测的过程。通常也称为POST——上电自检(Power On Self Test)

完整的POST自检包括对CPU、系统主板、基本的640KB内存、1MB以上的扩展内存、系统ROM BIOS的测试;CMOS中系统配置的校验;初始化视频控制器,测试视频内存、检验视频信号和同步信号,对VGA接口进行测试;对键盘、软驱、硬盘及CDROM子系统作检查;对并行口(打印机)和串行口(RS232)进行检查。自检中如发现有错误,将按两种情况处理:对于严重故障(致命性故障)则停机,此时由于各种初始化操作还没完成,不能给出任何提示或信号;对于非严重故障则给出提示或声音报警信号,等待用户处理。

当自检完成后,系统进行下一步骤:从硬盘、光盘或网络服务器上寻找操作系统进行启动,电脑的控制权将由操作系统完成。

在主板bios设置中只有部分硬件(键盘鼠标等非核心硬件)可以跳过自检过程,显卡不在这部分可以跳过系统自检的硬件之列,并且由于在开机自检过程中显卡的检测是强制性的,所以开机自检是无法跳过显卡的。

1、使用命令 nvidia-smi 查询简单的进程信息

2、使用命令 ll /proc/PID 查询详细的进程信息

3、查询 PID 对应的容器 - Docker Container


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/500546.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-06-16
下一篇2023-06-16

发表评论

登录后才能评论

评论列表(0条)

    保存