服务器常见故障处理

服务器常见故障处理,第1张

服务器常见故障处理

网络管理员90%的工作往往是诊断和解决各种各样的故障。为了说明诊断网络故障的一般过程,本文例举了几种故障情形,有的是常见的小问题,有的是比较艰巨的挑战。当你遇到类似的问题时,就可以按照本文例子的介绍,先问自己几个简单的问题,逐步隔离问题所在,最后找到真正的问题根源。

故障一、找不到验证密码的域服务器

毫无疑问,你也一定遇到过这样的情形:当你坐在一台工作站之前准备登录网络,Windows却报告说找不到用来验证密码的域服务器。要解决这个故障,首先要确定问题到底出在网络、工作站还是服务器上。从下面几个问题开始:

→哪些地方改变了?最近是否改动过网络,而这些改动可能导致当前的.问题?有没有添加新的服务器、拆除原有的服务器、改动过交换机或HUB?有没有添加或减少域控制器、将成员服务器提升为DC(域控制器)或者相反?

→其他工作站也存在类似的问题吗?

→服务器正在运行吗?

经过检查,你发现此前工作站一直顺利地运行,其他工作站没有遇到类似的问题,服务器也正常。根据故障现象,基本上可以确定故障出在工作站本身。接下来要确定工作站的那个地方出了故障,试试下面几个问题:

→工作站能够Ping到服务器吗?

→工作站获得了一个IP地址吗?

检测表明,工作站能够Ping到服务器,但Ping操作有时超时,这表明工作站和服务器之间只有断断续续的通信。在命令行上执行ipconfig/renew命令,多执行几次,工作站有时会更新IP地址,有时不会。这是工作站和服务器之间断续通信的症状。

现在将问题工作站的网络连接和另一台工作站的对换一下,新工作站在问题工作站的位置上也不能连接网络,而问题工作站却能从另一个网络位置顺利地连接网络。现在已经很清楚:问题工作站所在位置的电缆或Hub出了问题。

拆下故障位置上网络电缆连接Hub的那一端,将它接到另一个Hub上,故障依旧。现在可以肯定电缆就是引起故障的罪魁祸首了。

故障二、Windows服务不能启动

在一台Windows2000服务器上,部分服务设置成不用本地的系统帐户启动。一次重新启动Windows2000服务器之后,发现这些服务没有启动,必须手工打开服务,重新输入密码,然后启动服务。每次重新输入密码,都收到消息说:<用户名字>已被授予作为服务登录的权限。

要解决该故障,首先回答下面几个问题:

→哪些地方改变了?是否有人修改了服务器?

→这个服务以前能够启动吗?

→用户名称和密码正确吗?

查询修改记录发现,该服务器是一个DC,不久之前还是域控制器组织单元(OU,OrganizationalUnit)的成员。在移出该OU之前,这些服务一直能够顺利启动。另外,用来启动这些服务的用户名称和密码都是合法的。进一步研究发现,域控制器OU的成员有一些特殊的权限,其中包括作为服务登录的权限。当出现问题的服务器移出该OU时,服务器失去了那些权限。现在要做的是恢复服务器的权限。

要将权限授予服务器,请按照如下步骤操作:

→在管理控制台(MMC)中打开活动目录用户和计算机管理单元,再打开域控制器OU的“属性”对话框。

→在组策略页中,点击“默认域控制器策略”,然后点击“编辑”,打开组策略管理器。

→依次扩展计算机配置/Windows设置/安全设置,再扩展“本地策略”,然后点击“用户权利指派”。

→在右边的窗格中,右击“作为服务登录”,选择菜单“安全”。

→把用来启动服务的用户帐户加入到策略(图一),完成后点击“确定”。

1、服务器常见的故障及其排除方法

服务器中的某项服务被停止 •系统资源不足  •服务器软件故障

服务器软件故障是在服务器故障中占有比例最高的部份,约占70%。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。服务器软件设置不当也会可能造成网络故障。

管理方面的问题 

如用户的帐户和安全设置方面的潜在问题,服务权限没有给用户、配置不当或限制某些服务等问题 

2  服务器故障排除的基本原则

服务器故障排除的基本原则如下:

(1) 尽量恢复系统缺省配置

(2) 从基本到复杂

首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理;然后从可以运行的硬件开始逐步到现实系统为止;最后从基本操作系统开始逐步到现实系统为止。

(3)交换对比

首先在最大可能相同的条件下,交换操作简单效果明显的部件;其次是交换软件环境;再者是交换硬件,既交换硬件环境;最后是交换整机,既交换整体环境。

在服务器故障排除时,需要收集如下一些信息:

服务器信息:机器型号(P/N:)、机器序列号(S/N:)、Bios 版本、是否增加其它设备(如网卡,SCSI 卡,内存,CPU等)、硬盘如何配置和安装什么操作系统及版本。

故障信息:在POST(加电自检)时,屏幕显示的异常信息、服务器本身指示灯的状态和报警声,以及操作系统的事件记录文件等信息。

确定故障类型和故障现象:开机无显示;上电自检阶段故障;安装阶段故障和现象;操作系统加载失败和系统运行阶段故障。

 信息系统关系着企业的安全连续运行是IT运维管理追求的目标。IT运维管理与IT运维的成本、质量、速度有着很大的关系,当然也与IT系统的安全、连续和可用联系紧密。现今市场状况下,IT外包模式下许多IT运维管理都出现了许多问题,主要包括IT资产管理问题、IT外包管理问题、IT运维成本问题以及IT运维技术问题。it运维常见问题有哪些?

1. IT资产管理问题

当不同的IT资产运维被外包后,相对应会增加一部分责任人,无论是对它的维护还是更新升级改造,都会影响到IT资产的价值,同时也会对你IT资产的使用年限和配置信息产生影响,导致发生一定的变化,从而造成物理位置与实际不符、账实不符、安全责任无落脚、人机不符等问题。分散的、动态的IT资产管理是无法提供清晰的结构脉络给相关管理人员和服务人员的。

2. IT外包管理问题

完善的IT外包管理:选择外包商-使用外包商-考核评价外包商-优化外包商。信息技术基础构架库标准体系现在被许多企业采用,这种管理使外包服务过程更加的流程化。然而,它对企业对于外包商的选择、考核、评价优化均未提及。因此,就算流程管理做好了,IT运维管理外包还是没有到位。

3. IT运维成本问题

招标或者议标易确定外包价格,但是很难界定价格的合理性,也无法确定价格涵盖的服务项目。当甲方遇到突发状况时,部分服务商往往不能快速响应,可能服务人员不在本地,还有超出服务范围要追加费用这种情况的出现。有的时候公司付出高,回报低,影响到公司的未来生存发展,无法保证长期稳定的良好服务。如何衡量服务成本来确定服务价格是IT运维管理外包中的主要问题之一。

4. IT运维技术问题

针对不同的IT运维服务对象应采取相对应的技术方法。不能仅仅依靠对技术人员进行管理从而达到管理技术的目的。这样只会制约IT运维服务发展速度和质量。

事实上如何使IT运维管理外包安全稳定运行是一个既简单又复杂的问题,但是只要注意IT外包过程中所出现的一系列问题并寻找有效的解决办法,就可以保证企业的正常运行发展。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/560779.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-01
下一篇2023-07-01

发表评论

登录后才能评论

评论列表(0条)

    保存