G3服务器,2011年8月生产,安装后一直运行正常,近段常常出现死机现象,需要重启才能正常运行。——想必大伙儿基本能够猜到是什么故障了!
未料,网管这次重启,发现再也不能开机,用U盘引导也不能启动。
我到现场查看。发现启动过程中提示找不到引导文件。某一媒体硬件脱机,建议检查连接线。
再次用U盘引导,查看硬盘,发现三块硬盘均不能读取。
初步考虑,RAID出了问题。
度娘请教,建议到BIOS找到STOREG选项,启动即可。
但搜遍BIOS,没有找到这一选项。
无奈,请教联想客服(装机客服,不是800电话的客服,800打不通),工程师提示,可能RAID卡有故障。印证了笔者的判断。
打开上盖,拆掉RAID卡支架,发现RAID卡电池掉落,搭在下面的主板上。仔细检查RAID卡,没有看到明显异常。
将RAID卡电池恢复原位并固定,装好支架。
上述处理过程中,用吹风机在主板、硬盘架、CPU散热片、电源、内存槽等部位吹出不可思议的大量灰尘。
清理风扇灰尘,装好盖板。
开机,服务器完全恢复正常。
总结经验:1,服务器对工作环境的要求还是有的,不能随便放在什么地方就不管了;
2,服务器必须定期清理灰尘;
3,发现服务器频繁死机,首要的原因就是机内温度过高导致,特别是CPU。
这次服务器故障,就属于灰尘导致的散热不良,继而引起频繁死机。同时,因机内温度过高,导致RAID卡电池不干胶软化,电池脱落,搭在主板上导致短路。RAID卡保护失效所致。
此记,供参考。
要关机。因为若是移动硬盘是可以支持热插拔的,但是切记在开机或是关机的时候不要热插拔;若是连接在主板上的机内硬盘绝对不能带电插拔,这样会造成硬盘或是其他硬件的损坏,给你带来绝非想要的结果。如果不是移动硬盘的话, 热插拔主机硬盘会造成资料丢失,硬盘出现坏道,严重的烧毁硬盘.不过有些服务器类型的主板支持热插拔,普通主机的话是绝对不可以的.系统盘目前支持离线卸载,即在挂载该磁盘的云服务器处于“关机”状态,才可以卸载磁盘。因此,运行状态的云服务器需要先关机然后再卸载相应的系统盘。挂载至云服务器的系统盘,磁盘属性为“系统盘”,磁盘状态为“正在使用”。当系统盘从云服务器上卸载后,此时系统盘的磁盘属性变为“启动盘”,磁盘状态变为“可用”。欢迎分享,转载请注明来源:夏雨云
评论列表(0条)