服务器常见故障是什么,怎么排除

服务器常见故障是什么,怎么排除,第1张

1、服务器常见的故障及其排除方法

服务器中的某项服务被停止 •系统资源不足  •服务器软件故障

服务器软件故障是在服务器故障中占有比例最高的部份,约占70%。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。服务器软件设置不当也会可能造成网络故障。

管理方面的问题 

如用户的帐户和安全设置方面的潜在问题,服务权限没有给用户、配置不当或限制某些服务等问题 

2  服务器故障排除的基本原则

服务器故障排除的基本原则如下:

(1) 尽量恢复系统缺省配置

(2) 从基本到复杂

首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理;然后从可以运行的硬件开始逐步到现实系统为止;最后从基本操作系统开始逐步到现实系统为止。

(3)交换对比

首先在最大可能相同的条件下,交换操作简单效果明显的部件;其次是交换软件环境;再者是交换硬件,既交换硬件环境;最后是交换整机,既交换整体环境。

在服务器故障排除时,需要收集如下一些信息:

服务器信息:机器型号(P/N:)、机器序列号(S/N:)、Bios 版本、是否增加其它设备(如网卡,SCSI 卡,内存,CPU等)、硬盘如何配置和安装什么操作系统及版本。

故障信息:在POST(加电自检)时,屏幕显示的异常信息、服务器本身指示灯的状态和报警声,以及操作系统的事件记录文件等信息。

确定故障类型和故障现象:开机无显示;上电自检阶段故障;安装阶段故障和现象;操作系统加载失败和系统运行阶段故障。

    数据是服务器最核心的内容,而储存数据的硬盘则是服务器的灵魂,其他硬件出现故障问题不大,硬盘出现故障却是灾难级别,是致命的故障,如果硬盘的数据丢失,那么之前的努力将会前功尽弃。不管服务器配置有多高,硬盘有多新,多么先进,都会有出现故障的几率;因此在使用服务器过程中,需要预防服务器硬盘故障,以便服务器快速恢复运行,减少数据损耗,尽量减少损失。当服务器硬盘出现故障,我们要怎么应对呢?

    1、评估硬盘故障。   硬盘出现故障,服务器肯定出问题,这时候可以联系机房检查,评估硬盘损坏情况;如果损坏不大,系统还能正常运行,最好先备份数据,再更换硬盘。如果系统已经不能启动,可以更换硬盘重装系统,然后将旧硬盘挂在服务器上,方便备份数据;最坏的情况就是硬盘再也无法运行,里面的数据损失殆尽,一切从头开始。

     2、恢复数据。   硬盘出现故障后,首先关注是数据安全,如果数据损失不严重,硬盘还能正常使用,可以通过专门的软件来恢复;如果数据非常重要,损失很大,硬盘也很难正常使用,这就需要付费请专业的技术公司来操作,千成不要再盲目操作,减小数据恢复机率。

如何预防硬盘故障?

     1、定时备份;     定时备份是服务器管理和维护必须的措施;要预防硬盘故障带来数据损失,可不仅仅服务器里面备份,需要的是异地备份,或者是云备份,这样才能确保硬盘出现故障时,不会对备份数据造成损害。就算硬盘出现故障损失所有数据,有备份数据在,可以将损失降到最低。     

      2、硬盘做raid;     如果服务器硬盘比较大,可以通过raid技术优化整合单个或者多个硬盘,加强服务器硬盘的容错功能,硬盘出现故障时减少数据损失几率,保障服务器正常运行。

      3、经常检测;     在服务器使用过程中,要经常检测硬件性能,早发现早预防,如果检测结果显示硬盘运行数据有问题,那尽快最好备份或者更换硬盘。    在服务器租用和托管时,服务器硬盘出现了故障或者数据丢失先不要慌忙,要冷静。如果自己可以处理的就自己处理;如果自己不能处理,那就关闭服务器,停止硬盘数据的运转,找专业服务器数据恢复公司解决。简单地说就是不要盲目操作,因为这有可能导致数据无法恢复的,请谨记小心。 

                                                                                                                                                     数脉科技

                                                                                                                                                       https://www.shuhost.com/

1.检查关键部件:检查服务器的硬件,检查电源,主板,内存,硬盘等关键部件,如果发现有异常,可以更换掉,以确保系统正常运行。

2.检查系统:进入服务器操作系统,检查系统日志,检查服务器状态,检查系统服务状态,如果发现任何异常,可以尝试修复或重新安装系统。

3.检查负载:检查负载状态,如果发现负载过高,可以尝试优化系统,减少系统的负载,以提高系统的稳定性。

4.更新系统:检查系统是否有可用的更新,如果有,应该立即更新系统,以确保系统的稳定性。

5.复位服务器:如果以上方法都无法解决问题,可以尝试重新启动服务器,以确保系统的正常运行。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/633733.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-18
下一篇2023-07-18

发表评论

登录后才能评论

评论列表(0条)

    保存