机房在运x86服务器,主要通过什么来监测服务器硬件故障

机房在运x86服务器,主要通过什么来监测服务器硬件故障,第1张

x86服务器主要通过硬件管理接口(HMI)来监测服务器硬件故障,这是一个固定的接口,可以收集服务器的温度、电源及其他相关参数,以及其他硬件故障信息

另外,通过运行服务器管理软件,可以实时监测服务器的硬件状态,并且可以及时发现和处理可能出现的故障情况。

目前通过2种方式就能实现服务器硬件监控,

即:1、使用服务器端check_nrpe调用被监控端的check_openmanage就能来进行实现,大家的话只需要在被监控端安装omsa和check_openmanage就好了;

2、也能通过nagios服务器端直接通过check_openmanage来实现服务器硬件监控,使用这种方式的话就是需要在nagios服务端进行安装perl-net-snmp,并在被监控端安装omsa,snmp服务;不过需要提醒大家的是,一定要先能安装snmp服务再来安装omsa,也只有这样的话omsa才能自动进行更改snmp的相关配置文件以达到实现服务器硬件监控目的。

HP的服务器在硬件管理方面提供了自己管理工具hpacucli,通过该工具可以查看HP服务器的RAID信息,服务器硬盘等信息。

1)安装hpacucli工具(下载地址:HP hpacucli管理工具)

[root@monitor ~]#rpm -ivh hpacucli-9.40-12.0.x86_64.rpm

2)查看服务器RAID信息,硬盘是否正常。

[root@monitor~]# hpacucli ctrl all show config Smart Array P410i in Slot 0 (Embedded)(sn: 5001438018042FF0)array A (SAS, Unused Space: 0 MB) logicaldrive 1 (279.4 GB, RAID 1, OK) physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK)

3)通过hpacucli ctrl all show config detail命令可以详细地查看RAID和硬盘的信息。

[root@monitor ~]# hpacucli ctrl all show config detail Smart Array P410i in Slot 0 (Embedded)Bus Interface: PCISlot: 0Serial Number: 5001438018042FF0Cache Serial Number: PBCDH0CRH1FH62RAID 6 (ADG) Status: DisabledController Status: OKChassis Slot:Hardware Revision: Rev CFirmware Version: 5.14Rebuild Priority: MediumExpand Priority: MediumSurface Scan Delay: 15 secsMonitor and Performance Delay: 60 minElevator Sort: EnabledDegraded Performance Optimization: DisabledInconsistency Repair Policy: DisabledPost Prompt Timeout: 0 secsCache Board Present: TrueCache Status: OKAccelerator Ratio: 25% Read / 75% WriteDrive Write Cache: DisabledTotal Cache Size: 512 MBNo-Battery Write Cache: DisabledCache Backup Power Source: CapacitorsBattery/Capacitor Count: 1Battery/Capacitor Status: OKSATA NCQ Supported: TrueArray: A Interface Type: SAS Unused Space: 0 MB Status: OK Logical Drive: 1 Size: 279.4 GB Fault Tolerance: RAID 1 Heads: 255 Sectors Per Track: 32 Cylinders: 65535 Stripe Size: 128 KB Status: OK Array Accelerator: Enabled Unique Identifier: 600508B1001034373220202020200002 Disk Name: /dev/cciss/c0d0 Mount Points: /boot 99 MB Logical Drive Label: A00ADBD9PR7AMU1472 898D Mirror Group 0: physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) Mirror Group 1: physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK) physicaldrive 1I:1:1 Port: 1I Box: 1 Bay: 1 Status: OK Drive Type: Data Drive Interface Type: SAS Size: 300 GB Rotational Speed: 10000 Firmware Revision: HPD4 Serial Number: ECA1PC80GTS31234 Model: HP EG0300FBDSP PHY Count: 2 PHY Transfer Rate: 6.0GBPS, Unknown physicaldrive 1I:1:2 Port: 1I Box: 1 Bay: 2 Status: OK Drive Type: Data Drive Interface Type: SAS Size: 300 GB Rotational Speed: 10000 Firmware Revision: HPD7 Serial Number: PMX6902D Model: HP EG0300FBDBR PHY Count: 2 PHY Transfer Rate: 6.0GBPS, Unknown

HP官方还有一个hpasmcli管理工具,可以很详细查看服务器CPU,内存,处理器,电源等的温度信息。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/504089.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-06-17
下一篇2023-06-17

发表评论

登录后才能评论

评论列表(0条)

    保存