zabbix怎么监控linux服务器硬件信息

zabbix怎么监控linux服务器硬件信息,第1张

HP的服务器在硬件管理方面提供了自己管理工具hpacucli,通过该工具可以查看HP服务器的RAID信息,服务器硬盘等信息。

1)安装hpacucli工具(下载地址:HP hpacucli管理工具)

[root@monitor ~]#rpm -ivh hpacucli-9.40-12.0.x86_64.rpm

2)查看服务器RAID信息,硬盘是否正常。

[root@monitor~]# hpacucli ctrl all show config Smart Array P410i in Slot 0 (Embedded)(sn: 5001438018042FF0)array A (SAS, Unused Space: 0 MB) logicaldrive 1 (279.4 GB, RAID 1, OK) physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK)

3)通过hpacucli ctrl all show config detail命令可以详细地查看RAID和硬盘的信息。

[root@monitor ~]# hpacucli ctrl all show config detail Smart Array P410i in Slot 0 (Embedded)Bus Interface: PCISlot: 0Serial Number: 5001438018042FF0Cache Serial Number: PBCDH0CRH1FH62RAID 6 (ADG) Status: DisabledController Status: OKChassis Slot:Hardware Revision: Rev CFirmware Version: 5.14Rebuild Priority: MediumExpand Priority: MediumSurface Scan Delay: 15 secsMonitor and Performance Delay: 60 minElevator Sort: EnabledDegraded Performance Optimization: DisabledInconsistency Repair Policy: DisabledPost Prompt Timeout: 0 secsCache Board Present: TrueCache Status: OKAccelerator Ratio: 25% Read / 75% WriteDrive Write Cache: DisabledTotal Cache Size: 512 MBNo-Battery Write Cache: DisabledCache Backup Power Source: CapacitorsBattery/Capacitor Count: 1Battery/Capacitor Status: OKSATA NCQ Supported: TrueArray: A Interface Type: SAS Unused Space: 0 MB Status: OK Logical Drive: 1 Size: 279.4 GB Fault Tolerance: RAID 1 Heads: 255 Sectors Per Track: 32 Cylinders: 65535 Stripe Size: 128 KB Status: OK Array Accelerator: Enabled Unique Identifier: 600508B1001034373220202020200002 Disk Name: /dev/cciss/c0d0 Mount Points: /boot 99 MB Logical Drive Label: A00ADBD9PR7AMU1472 898D Mirror Group 0: physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) Mirror Group 1: physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK) physicaldrive 1I:1:1 Port: 1I Box: 1 Bay: 1 Status: OK Drive Type: Data Drive Interface Type: SAS Size: 300 GB Rotational Speed: 10000 Firmware Revision: HPD4 Serial Number: ECA1PC80GTS31234 Model: HP EG0300FBDSP PHY Count: 2 PHY Transfer Rate: 6.0GBPS, Unknown physicaldrive 1I:1:2 Port: 1I Box: 1 Bay: 2 Status: OK Drive Type: Data Drive Interface Type: SAS Size: 300 GB Rotational Speed: 10000 Firmware Revision: HPD7 Serial Number: PMX6902D Model: HP EG0300FBDBR PHY Count: 2 PHY Transfer Rate: 6.0GBPS, Unknown

HP官方还有一个hpasmcli管理工具,可以很详细查看服务器CPU,内存,处理器,电源等的温度信息。

您好

网上找到的一个教程

数据中心管理软件之Intel DCM平台概述

对于数据中心的节能减耗、监控和管理,是数据中心的运维管理者们最为关心的问题。那么数据中心IT系统内部需要监管哪些内容?

通常来讲,监控的目的在于保护数据中心内IT系统的正常、有效运行,在事故发生之前侦测出潜在危机。因此,数据中心监管核心应该是对IT系统运行状态的监控,而最直接有效的监控应该是直接对IT设备运行状态进行监控。

例如,服务器内风扇转速与CPU温度等是最直接、最迅速影响IT设备正常运行的因素。有时候即使数据中心内空调运转正常,整体环境参数值也在预设范围内,但某服务器却因为某种原因出现服务器内风扇的转速不正常、CPU过热......,事实上,温度、状态等都是需要监管的。

我们都知道,单靠人工是不可能完成的,那么依靠IT设备自身的监管功能,也必将面临每台服务器都有自己的监控和管理界面,这对数据中心监管的最终需求--降低能耗来说,并不是什么好事情。那么,怎样帮助数据中心的CIO们解决这种难题呢?

英特尔数据中心管理平台IntelDCM

英特尔在09年春季IDF上,正式发布英特尔数据中心管理平台软件技术,可以实时监控、管理和优化数据中心的功耗。作为此前刚发布的至强 5500系列处理器新产品组件之一,英特尔数据中心管理平台将充分利用其强大的平台性能,结合英特尔节点管理器技术,为用户提供最优的数据中心能耗管理方案。

这款数据中心管理平台,得到了美国服务器制造商Supermicro公司,国内服务器制造商浪潮和宝德,以及国内IT运维管理软件开发商游龙科技支持。

DCM(数据中心管理产品)应具备三大基本功能,即监测、管控和报表。英特尔数据中心管理平台 (IntelDataCenterManager)是监控、管理数据中心的机架和服务器组电、热等能耗的软件技术,IT部门利用它来实现提高机架密度、降低能耗与散热成本,从而优化机房布局并轻松获益。

监测:实时采集能源信息,包括服务器功耗和温度等能耗信息。

事实上,在以前,这些信息是无法得到的,即便是得到,也不是精确值。任何的管理第一步必定是监测,可以说,没有监测就没有管理。要控制温度,就要先测量温度要管理功耗,要要先测量到功耗的信息。

管控:配置能源使用策略,管理服务器集群的功耗。

用户可以根据数据中心的情况,优化并使用策略。这意味着,在服务器上,用户第一次有能力对服务器功耗使用策略。并且,能源使用策略,可以对整个数据中心进行优化配置。

报表:通过对能源使用报表的分析,帮助用户梳理能源消耗的时间、地点等信息。

事实上,报表无非就是日志分析功能,其意义在于,数据中心的运维管理者们,关注的是什么时候消耗最大能源,什么地方消耗能源最集中,如果这些问题由报表自动生成,那么管理者就有据可依,可以帮助他们更好的把握和选择最合适的能源使用策略。

为了发挥最好的性能,安装英特尔数据中心管理平台的服务器至少需要:一个双核的2.6Ghz或更高的处理器,4GBRAM,60GB硬盘空间。

IntelDCM平台特点

英特尔数据中心管理平台支持所有具备英特尔节点管理器并能够通过基板管理控制器(BMC)发出英特尔节点管理器IPMI规范命令的原始设备制造商(OEM)平台。该技术专门提供在不影响工作性能的同时进行的服务器组能源管理。为了达到这一目标,英特尔数据中心管理平台为每一台独立的服务器动态调整能耗标准以适应该服务器工作量的变化、使用率和由此改变的能源需求量。我们现在正在大型企业和主要网络数据中心中进行广泛测试。

IntelDCM平台应用场景

英特尔数据中心管理平台能使您的机架在当前功耗和温度范围内,存放更多设备,最大程度优化机架密度。

结合英特尔节点管理器(IntelNodeManager)技术,不受操作系统限制,便捷管理数据中心。

IntelDCM调整数据中心能耗

根据服务器的优先级别动态分配电源,使用实际的和观察到的数据,重新估计和设计数据中心的制冷系统和电源供给。通过分析供电和负载,诊断机架空间的使用效率,观察数据中心供电系统和高温异常等情况,并及时提醒用户。

IntelDCM带来的实际价值

首先是节约能源,节约功耗。显而易见,通过监控、管理和报表功能,可以很好地帮助管理者们找到能耗的热点,并对热点能耗进行有效的管控。据张泽军介绍,可以节约15-20%的能源消耗。

举例来说,如果没有对CPU温度、频率等信息进行监管,可能当下班时,服务器使用率就降低,可CPU的2.8G主频还在运行,这时就有必要动态的给CPU降低频率,而功耗也就大幅降低。

其次,可以增加机房和机架密度,节约空间。事实上,更多的情况不是空间受限制,而是能耗受限制。比如42U服务器,放不满机架,因为提供机架的能源、电源不够。而通过数据中心管理平台,可以增加每个机架的密度,能源动态分配,充分利用机架空间,增加机房和机架的密度。这也达到了节约能耗的目的。

在数据中心管理中,还有一个不能忽视的趋势。由于虚拟化的普及和应用,包括数据中心在内的管理软件市场,必将涉及虚拟机的管控。显然,虚拟机消耗的资源,消耗的CPU、能源、内存等,也是未来数据中心管理中的一个难题。

英特尔数据中心管理平台功能一览表

配置数据中心层级 从配置管理器(CMDB)或者其他资产数据库中通过XML模型便捷地导入资产信息

数据中心合计和趋势 实时监控节点能耗和入口温度数据,汇总所有能耗和温度数据并提供给用户或既定团队,为优化管理策略储存相应的历史数据信息

制定警报 在制定能耗和热能事件的基础上接收警报。通过自定义各种策略改变能耗上限来自动处理事件

智能控制能耗上限 根据基于可用资源的工作量的变化动态地管理能耗预算,同时支持多个有效策略,自动管理机架和服务机组能耗,并提供应对紧急情况的防护

策略可配置性 根据时间规划调整能耗上限策略和数据中心的切实环境。

无需代理软件管理 Intel? DCM不需要在能耗管理节点上安装任何代理软件。

易集成 易共存 Intel? DCM可以存在于一个独立的服务器,也可以与其他管理软件共存于同一台服务器

高扩展性支持 管理服务器可以管理多达5000个节点

名词解释:什么是英特尔节点管理器

英特尔节点管理器位于IntelNextGenerationServerChipsetplatforms(英特尔下一代服务器芯片 Nehalem-EP平台)。它为独立的服务器提供能耗温度监控和基于各种策略的能源管理。它可以通过基于规范IPMI协议的接口、由支持的基板管理控制器(BMC)使用。它需要一个类似PMBusTM的仪器供电源。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/784451.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-24
下一篇2023-08-24

发表评论

登录后才能评论

评论列表(0条)

    保存