服务器常见故障的诊断与解决:服务器故障排除第一部分 服务器故障排除的基本原则性问题服务器故障排除一、服务器开机黑屏故障排查1.检查供电环境,零-火;零-地电压?2.检查电源指示灯,如果亮,正常吗?3.按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗?4.是否更换过显示器,更换另一台显示器。5.去掉增加内存6.去掉增加的CPU7.去掉增加的第三方I/O卡8.检查内存和CPU插的是否牢靠9. Clear CMOS10.更换主要备件,如系统板,内存和CPU服务器故障排除二、服务器故障排除的基本原则1.尽量恢复系统缺省配置a:硬件配置:去除第三方厂商备件和非标配备件;b:资源配置:清除CMOS,恢复资源初始配置;c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序;d: TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗?2.从基本到复杂a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。c:软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。3.交换对比a:在最大可能相同的条件下,交换操作简单效果明显的部件;b:交换NOS载体,既交换软件环境;c:交换硬件,既交换硬件环境;d:交换整机,既交换整体环境;服务器故障排除三、服务器故障排除需要收集哪些信息?服务器信息:1.机器型号2.机器序列号(S/N:如:NC00075534)3.Bios版本4.是否增加其它设备,如网卡,SCSI卡,内存,CPU5.硬盘如何配置,是否做阵列,阵列级别6.安装什么操作系统及版本(Windows Server, Netware, Sco, others)
您好BRD 主板上发生错误。
CNFG 发生硬件配置错误。
DASD 发生硬盘驱动器错误。
FAN 风扇发生故障,或者是运行过慢,或者是
已卸下风扇。TEMP 指示灯可能也会点
亮。
LINK 保留。
LOG 已将错误消息写入系统事件日志。查看IMM 系统事件日志和系统错误日志,获取有关错误的信息。
MEM 当只有MEM 指示灯点亮时,才表示发生
了内存错误。
当MEM 指示灯和CNFG 指示灯都点亮
时,表示内存配置无效。
O V E R SPEC
由于某个电源通道上出现电源超负荷情
况,所以关闭了服务器。电源功率超过最
大额定值。
PS 电源发生故障。
RAID RAID阵列出错。
SP 服务处理器(IMM)发生故障。
TEMP 系统温度已超出阈值级别。发生故障的风
扇会导致TEMP 指示灯点亮。
VRM 保留。
希望的回答对您有帮助!
1、服务器系统蓝屏并死机虽然服务器硬件的性能优于计算机,但服务器承载的数据和处理量更多,而且服务器使用时间长,难免会出现死机、硬件故障或系统漏洞等问题。如果不定期清理垃圾和缓存,也会导致服务器死机,响应缓慢。
2、远程桌面超出连接数
服务器连接数为2,如果上次登录直接关闭远程,不注销账号,服务器默认登录。一般需要重启服务器。我们都知道服务器需要24小时不间断运行,如果重启服务器会给我们带来或多或少的损失,如果是高峰期,损失就更大了。我们还有另一种方法,就是使用 mstsc/console 命令强制服务器桌面。打开“运行”框,输入“mstsc/v:xxx.xxx.xxx.xxx(服务器IP)/console”,即可强制登录远程桌面。
3、文件无法删除
有时候我们在删除服务器文件的时候,发现无论如何都删不掉。这种情况可能是文件仍在运行。我们可以重启删除或者使用CMD命令,输入arrtib-ashr要删除的文件夹名称,然后输入delete要删除的文件夹名称即可成功删除文件。需要注意的是,使用此命令删除的文件无法恢复,请谨慎使用。
4、系统端口的隐患
服务器的稳定性和安全性是大家特别关心的问题,因为关系到我们的业务能否稳定运行。为了服务器能够稳定运行,除了保证基本功能外,我们一般尽量不做额外的功能,以免端口过多带来更多风险。如果无法避免这些风险端口,那么我们可以修改注册表,将这些高风险端口设置为秘密端口,以提高端口的安全性,确保服务器不受影响。
服务器遇到问题和故障是不可避免的。我们能做的就是未雨绸缪,积极应对。如果真的发生了,要及时处理,减少损失。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)