Linux服务器如何查看GPU信息

Linux服务器如何查看GPU信息,第1张

Linux查看显卡信息:

[python] view plain copy

lspci | grep -i vga  

使用nvidia GPU可以:

[python] view plain copy

lspci | grep -i nvidia  

前边的序号 "00:0f.0"是显卡的代号(这里是用的虚拟机)

查看指定显卡的详细信息用以下指令:

[python] view plain copy

lspci -v -s 00:0f.0  

Linux查看Nvidia显卡信息及使用情况

Nvidia自带一个命令行工具可以查看显存的使用情况:

[python] view plain copy

nvidia-smi  

表头释义: 

Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A; 

Temp:显卡内部的温度,单位是摄氏度;

Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;

Pwr:能耗表示; 

Bus-Id:涉及GPU总线的相关信息; 

Disp.A:是Display Active的意思,表示GPU的显示是否初始化; 

Memory Usage:显存的使用率; 

Volatile GPU-Util:浮动的GPU利用率;

Compute M:计算模式; 

下边的Processes显示每块GPU上每个进程所使用的显存情况。

如果要周期性的输出显卡的使用情况,可以用watch指令实现:

[python] view plain copy

watch -n 10 nvidia-smi  

命令行参数-n后边跟的是执行命令的周期,以s为单位。

你这种情况,一般由于以下原因造成的:

1 电脑系统中毒或中了恶意软件。

2 cpu 风扇坏 cpu 温度过高,过热保护。

3 电源坏,或添加了新硬件,电源供电不足。

4 显卡或显卡风扇坏。

5 主板坏,主板芯过热。

解决办法:

1 查看杀毒软件是否有杀到病毒,可以确定,是否是电脑系统中毒或中了恶意软件 原因导致的,如果有病毒,建议用多种杀毒软件组合杀毒,还是不行的话,重装或恢复系统,可以解决。

2 下载鲁大师软件,测试下电脑 各硬件的温度,打开机箱,看下cpu 风扇、显卡风扇转动是否正常,查出问题,换个cpu 风扇即可。30 -100元左右。

3 如果电脑加了独立显卡,电源功率不够,那只能换个更大功率的电源了,电源用久了,不稳定,那也要换个电源来测试。

4 关机,用手摸下 主板南桥、北桥芯片、显卡芯片,如果很烫手,那就是有可能坏了,要送修了。

请从我上面说的方面入手,去检查。

CPU不要超过70度。

显卡不要超过90度。

硬盘不要超过60度

主板桥的话,以前的工艺一般不要超过70度,现在的工艺耐温高的多,105度以下都是正常。

你的温度只是偏高,还属于正常。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/632892.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-18
下一篇2023-07-18

发表评论

登录后才能评论

评论列表(0条)

    保存