IBM power4(5)系列的设备上的黄灯(系统警告灯)长亮,并不一定是硬件报错。引起此种现象有多种原因,可能是由于硬件故障,也可能是由于机房环境(如电流,温度,网络断线),也可能由于用户的误操作(如非正常关机,等等)引起。
其判别方法如下:
1,诊断系统,判断是否硬件故障。
Root用户执行diag;
回车后,进第2项,advanced diagnostics routines;
选system verification;
选all resources,回车;
按F7进行执行检测;
看返回结果,是否存在故障。
如存在故障,记录故障及errpt –a,反馈给IBM公司或维护商。
2,如无故障。清除警告灯。
Root用户执行diag;
回车后,进第3项,task selection;
选Identify and Attention Indicators;
Set System Attention Indicator to Normal,回车;
按F7进行执行。
1、查找在AIX上清除黄灯(报警)的方法。
方法1、diag =>task .....=>log repair action =>sysplanar0, enter,F7
方法2、用串口进入ASM
问题描述:如何熄灭故障报警灯?
解答:
在日常工作中,有时会遇到机器面板上的橙色有感叹号标示的硬件故障报警灯亮的情况。硬件故障报警灯是一个发光二极管,它亮表示系统检测到了硬件故障,管理员应该注意。但是硬件故障报警灯是非常敏感的,很多情况下并不是硬件产生了故障它才亮,例如热插拔某些信号线或者电缆,用户非正常关机等都可能导致该警报灯亮。此时,管理员应该首先检查系统错误日志errpt,看一下是否真的有硬件错误。如果没有,那么我们可以先将这个灯熄灭,如果真的有硬件上的故障,它会再次亮的。
熄灭故障报警灯有多种方法,普通用户常用的是用命令行方式或者用HMC。
在命令行方式下,运行diag命令:
diag
->回车
->Task Selection
->Identify and Attention Indicators
->回车选择 Set System Attention Indicator to NORMAL
->F7 提交,OK
在HMC控制台上:
选择左列的“Serivce Applications”
->Serivce Focal Point
右侧的LED Management中您可以看到LED State,右键可以把它从On状态变到Off状态。
##注意:报警肯定是有原因的,为了生产环境的安全,请分析过报警信息后再做日志的清理和报警灯的关闭!!
一、HMC的WEB页面下的操作。
登陆HMC;
找台笔记本网卡配置IP 192.168.0.144(不限于144,只要是192.168.0网段非147即可),用网线连接小型机后面HMC的上面的1网口,从IE地址栏中输入https://192.168.0.147 点击出现的授权界面确定,在出现的用户名和密码窗口中分别填写admin和admin(密码有可能有变)登陆到HMC的WEB界面。
在HMC中直接清除以上日志方法:System Service Aids-->
Error/Event Logs-->
Clear all error/event log entries
即可清除日志
关闭面板报警灯方法:System Configuration-->
Service Attention Indicator-->
Turn off the system attention indicator
选项即可关闭前面板的橙色报警灯
二、在AIX下用命令及菜单的处理方法(来自网上,不过自己动手做过)
AIX yellow attention clear
如果发现前面板有报警灯,请重置告警灯状态 ( 硬件没有报错的状态下!)
1、使用root用户登陆系统,执行“diag”命令,回车继续;
2、看到“Press the F3 key to exit or press Enter to continue.”时,回车继续
3、选择“Task Selection”,回车继续;
4、选择“Log Repair Action”,回车继续;
5、选择“sysplanar0”,回车;
6、此时“sysplanar0”前面会出现一个“+”号;
7、按“F7”或者“ESC+7”提交;
8、看到“Use Enter to continue.”时,回车继续;
9、此时“sysplanar0”前面的“+”号会变成“*”号;
10、按“F10”离开“diag”。
方法一:
灭故障灯的办法:
以root权限运行 /usr/lpp/diagnostics/bin/usysfault,如果显示结果不是normal的
话。
运行/usr/lpp/diagnostics/bin/usysfault -s normal ,故障灯就会熄灭。
方法二:
关闭小型机橙色告警灯:
使用root用户登陆系统,执行“diag”命令,回车继续;
1、选择“Task Selection”,回车继续;
2、选择“Identify and Attention Indicators”,回车继续;
3、选择“Set System Attention Indicator to Normal”,回车,“Set System
Attention Indicator to Normal”前面出现“+”号,表示选定此项;
4、按“F7”提交。以上步骤可以熄灭小型机橙色告警灯
黄色报警等亮并不一定表示系统出现问题,如果在errpt中有过硬件报错(可能是临时错误或异常操作等)都会导致黄色报警灯亮。根据上述现象,需要重新设置一下LED,具体步骤如下:
1.以root用户身份登录进入系统;
2.在命令行输入“diag”命令,进入下一级菜单
3.选择”Task Selection(Diagnostics,Advanced Diagnostics,Service Aids,etc.)”进入下一级菜单
4.选择”Log Repair Action”进入下一级菜单
5.选择列示的所有资源,然后按下F7键执行
LOG REPAIR ACTION
[TOP]
+ sys0 ——-00-00 –System Object
+ sysplanar0 -00-00 –System Planar
+ oppanel —-00-00 –Operator panel
+ mem0 ——-00-00 –Memory
+ proc0 ——00-00 –Processor
+ L2cache0 —00-00 –L2 cache
+ scsi1 ——30-58 –Wide SCSI I/O Controller
[MORE...22]
6.执行完毕退出诊断,报警灯将熄灭,恢复正常.
还有可能就是要进asmi跟hmc来清除了
方法二:
使用root用户登陆系统,执行“diag”命令,回车继续;
1、选择“Task Selection”,回车继续;
2、选择“Identify and Attention Indicators”,回车继续;
3、选择“Set System Attention Indicator to Normal”,回车,“Set System
Attention Indicator to Normal”前面出现“+”号,表示选定此项;
4、按“F7”提交。以上步骤可以熄灭小型机橙色告警灯
方法二
通过HMC熄灭p5叹号灯:
1. 首先登录进入到HMC的管理界面,将左边主菜单的Service Applications选项的“ + ”展开,然后点击Service Focal Point选项,再点击右图的Service Utilities选项 。
2. 选中Service Utilities对话框中相应的服务器 。
3. 点击Selected,然后再点击Launch ASM Menu选项。
4. 点击“ OK ”选项 。
5. 点击Accept选项 。
6. 在弹出的对话框中填入User ID :admin,Password :admin,然后点击Log in,进入服务器的ASMI菜单。
7. 点击System Configuration ->System Indicator ->System Attention Indicator
8. 点击Turn off the system attention indicato
数据是服务器最核心的内容,而储存数据的硬盘则是服务器的灵魂,其他硬件出现故障问题不大,硬盘出现故障却是灾难级别,是致命的故障,如果硬盘的数据丢失,那么之前的努力将会前功尽弃。不管服务器配置有多高,硬盘有多新,多么先进,都会有出现故障的几率;因此在使用服务器过程中,需要预防服务器硬盘故障,以便服务器快速恢复运行,减少数据损耗,尽量减少损失。当服务器硬盘出现故障,我们要怎么应对呢?
1、评估硬盘故障。 硬盘出现故障,服务器肯定出问题,这时候可以联系机房检查,评估硬盘损坏情况;如果损坏不大,系统还能正常运行,最好先备份数据,再更换硬盘。如果系统已经不能启动,可以更换硬盘重装系统,然后将旧硬盘挂在服务器上,方便备份数据;最坏的情况就是硬盘再也无法运行,里面的数据损失殆尽,一切从头开始。
2、恢复数据。 硬盘出现故障后,首先关注是数据安全,如果数据损失不严重,硬盘还能正常使用,可以通过专门的软件来恢复;如果数据非常重要,损失很大,硬盘也很难正常使用,这就需要付费请专业的技术公司来操作,千成不要再盲目操作,减小数据恢复机率。
如何预防硬盘故障?
1、定时备份; 定时备份是服务器管理和维护必须的措施;要预防硬盘故障带来数据损失,可不仅仅服务器里面备份,需要的是异地备份,或者是云备份,这样才能确保硬盘出现故障时,不会对备份数据造成损害。就算硬盘出现故障损失所有数据,有备份数据在,可以将损失降到最低。
2、硬盘做raid; 如果服务器硬盘比较大,可以通过raid技术优化整合单个或者多个硬盘,加强服务器硬盘的容错功能,硬盘出现故障时减少数据损失几率,保障服务器正常运行。
3、经常检测; 在服务器使用过程中,要经常检测硬件性能,早发现早预防,如果检测结果显示硬盘运行数据有问题,那尽快最好备份或者更换硬盘。 在服务器租用和托管时,服务器硬盘出现了故障或者数据丢失先不要慌忙,要冷静。如果自己可以处理的就自己处理;如果自己不能处理,那就关闭服务器,停止硬盘数据的运转,找专业服务器数据恢复公司解决。简单地说就是不要盲目操作,因为这有可能导致数据无法恢复的,请谨记小心。
数脉科技
https://www.shuhost.com/
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)