服务器监控硬盘状态

服务器监控硬盘状态,第1张

服务器来说,硬盘因为其机械结构,是最容易出现故障的设备。但恰恰是这最容易出现故障的设备中,存储着对企业来说最至关重要的IT资源——数据。一旦硬盘出现故障,会给企业带来重大的损失。据统计,为了解决硬盘故障带来的损失,目前全球每年的数据恢复市场价值大约在千亿美元——而这仅仅是是企业损失的一小部分。近年来,为了解决这一问题衍生出了大量的技术如:Raid、双机热备等。但这些技术都是在基于增加磁盘的数量的方式来尝试解决问题,降低了数据丢失的概率,但同时大大增加了运维成本,提高了管理的难度。

为此,蚁巡运维平台尝试引入一种新的方式,通过远程实时监控服务器硬盘的健康状态,达到在不增加硬件成本和管理成本的基础上保障数据安全的做法。通过蚁巡运维平台,可以自动发现安装了SMART标准技术的硬盘并远程监控其磁盘的健康指标。

S.M.A.R.T的全称为“Self-Monitoring Analysis and Reporting Technology”,即“自我监测、分析及报告技术”。支持S.M.A.R.T技术的硬盘可以通过硬盘上的监测指令和主机上的监测软件对磁头、盘片、马达、电路的运行情况、历史记录及预设的安全值进行分析、比较。当出现安全值范围以外的情况时,就会自动向用户发出警告。几乎所有主流的硬盘,包括固态硬盘都支持这一技术。但该技术只适用于单机环境,且必须手工获取数据,使用该技术防止硬盘故障的管理成本很高。而在蚁巡中,可以批量的、远程的、实时的监控使用了该技术的硬盘,大大降低了管理成本。

同时,通过蚁巡还可以获得硬盘的使用时间、使用次数等基本指标数据。可以有效的评估硬盘的使用情况,从而进一步评估设备的使用率、寿命等信息。

据统计,通过这项技术,可以提前发现超过60%的硬盘故障,给企业带来的价值无可估量。

IBM可以通过管理口AMM,在客户端配置一个IP地址段与其服务器地址同网段,然后输入192.168.70.125 进入IBM管理页面,用户名:UERSID 密码:PASSW0RD其中“O”是数字“0”

然后有选择磁盘的信息一栏。。希望能对您有所帮助

HP的服务器在硬件管理方面提供了自己管理工具hpacucli,通过该工具可以查看HP服务器的RAID信息,服务器硬盘等信息。

1)安装hpacucli工具(下载地址:HP hpacucli管理工具)

[root@monitor ~]#rpm -ivh hpacucli-9.40-12.0.x86_64.rpm

2)查看服务器RAID信息,硬盘是否正常。

[root@monitor~]# hpacucli ctrl all show config Smart Array P410i in Slot 0 (Embedded)(sn: 5001438018042FF0)array A (SAS, Unused Space: 0 MB) logicaldrive 1 (279.4 GB, RAID 1, OK) physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK)

3)通过hpacucli ctrl all show config detail命令可以详细地查看RAID和硬盘的信息。

[root@monitor ~]# hpacucli ctrl all show config detail Smart Array P410i in Slot 0 (Embedded)Bus Interface: PCISlot: 0Serial Number: 5001438018042FF0Cache Serial Number: PBCDH0CRH1FH62RAID 6 (ADG) Status: DisabledController Status: OKChassis Slot:Hardware Revision: Rev CFirmware Version: 5.14Rebuild Priority: MediumExpand Priority: MediumSurface Scan Delay: 15 secsMonitor and Performance Delay: 60 minElevator Sort: EnabledDegraded Performance Optimization: DisabledInconsistency Repair Policy: DisabledPost Prompt Timeout: 0 secsCache Board Present: TrueCache Status: OKAccelerator Ratio: 25% Read / 75% WriteDrive Write Cache: DisabledTotal Cache Size: 512 MBNo-Battery Write Cache: DisabledCache Backup Power Source: CapacitorsBattery/Capacitor Count: 1Battery/Capacitor Status: OKSATA NCQ Supported: TrueArray: A Interface Type: SAS Unused Space: 0 MB Status: OK Logical Drive: 1 Size: 279.4 GB Fault Tolerance: RAID 1 Heads: 255 Sectors Per Track: 32 Cylinders: 65535 Stripe Size: 128 KB Status: OK Array Accelerator: Enabled Unique Identifier: 600508B1001034373220202020200002 Disk Name: /dev/cciss/c0d0 Mount Points: /boot 99 MB Logical Drive Label: A00ADBD9PR7AMU1472 898D Mirror Group 0: physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) Mirror Group 1: physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK) physicaldrive 1I:1:1 Port: 1I Box: 1 Bay: 1 Status: OK Drive Type: Data Drive Interface Type: SAS Size: 300 GB Rotational Speed: 10000 Firmware Revision: HPD4 Serial Number: ECA1PC80GTS31234 Model: HP EG0300FBDSP PHY Count: 2 PHY Transfer Rate: 6.0GBPS, Unknown physicaldrive 1I:1:2 Port: 1I Box: 1 Bay: 2 Status: OK Drive Type: Data Drive Interface Type: SAS Size: 300 GB Rotational Speed: 10000 Firmware Revision: HPD7 Serial Number: PMX6902D Model: HP EG0300FBDBR PHY Count: 2 PHY Transfer Rate: 6.0GBPS, Unknown

HP官方还有一个hpasmcli管理工具,可以很详细查看服务器CPU,内存,处理器,电源等的温度信息。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/629562.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-17
下一篇2023-07-17

发表评论

登录后才能评论

评论列表(0条)

    保存