由于硬件故障造成宕机的原因有哪些?该如何处理?

由于硬件故障造成宕机的原因有哪些?该如何处理?,第1张

—、服务器出现宕机的原因

1.运行环境出现问题,机房断电导致的服务器断电(欠压,过载,波动)、机房温度过高,散热不良、资源冲突、DirectX文件的损坏、系统不完善等等原因而造成服务器宕机。

⒉.服务器不堪负重,最常见的如磁盘空间耗尽、访问值过大、程序中毒、遭受攻击等大规模高消耗服务器资源情况。

3.由于主备数据不—致导致的复制问题。

4.性能问题,运维运行糟糕的SQL或Schema和索引设计等。

二、服务器宕机应该从哪些方面检查呢?

①硬件

(1)检查硬件是否有冲突

(2)对比服务器电源所负载的功率判断电源是否出现故障

(3)扫描硬盘表面检查是否有坏道

(4)通过错误报告和操作系统的报错信息来判断

(5)使用替换法判断主板、CPU、SCSI/RAID卡或其他PCI设备是否出现故障。

②软件

(1)检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因

(2)在判断硬件没有故障后,考虑系统软件的BUG和漏洞原因

(3)如果是因为软件使用不当或系统工作压力过大,可以适当降低服务器的工作压力

(4)电脑病毒。

以上就是有关服务器宕机的原因有哪些,应该从哪些方面检查的知识介绍。

在想解决处理办法之前要知道服务器宕机的两种形态:假死机和死机

假死机(非蓝屏死机)是由于硬件资源暂时性地被消耗殆尽,因而无法对外部指令进行响应的现象, 通常是网站处于访问高峰期,带宽等资源跑满,这时只需要等待一定的时间,待服务器腾出更多的硬件资源即可恢复正常。

而死机,如果通过ping测试服务器,键盘切换数字锁定键(NumLock)或大写锁定键(Caps Lock)功能, 显示器无画面输出,或者鼠标光标没有任何反应则表明服务器硬件故障。

再了解服务器出现宕机的常见原因 :

1.在运行环境的问题中,最普遍的问题时磁盘空间耗尽。

2.在性能问题中,最普通的服务器宕机原因确实是运行很糟糕的SQL, 但也不一定都是这个原因,比如也有很多问题是由于服务器Bug或错误的行为导致的。

3.糟糕的Schema和索引设计是第二大影响性能的问题。

4.复制问题通常由于主备数据不一致导致。

5.数据丢失问题通常由于drop table的错误操作导致,并总是便随着缺少可用备份的问题。

如何查看服务器宕机的原因:

a、是否是应用程序导致内存溢出或者泄露,out of memory导致

b、是否是进程过多或者不断创建,耗尽资源导致

c、是否是数据库程序死锁,连接数过多导致

d、是否是应用程序异常导致

e、是否是流量负载过大导致

f、 是否是遭受黑客入侵攻击导致

g、是否是误操作导致

服务器宕机自行解决办法:

1.要即时发现服务器宕机的问题。时间就是金钱,这是不变的真理。我们要第一时间, 发现宕机的问题,服务器宕机时,为了避免造成不必要的损失,要尽早通知IDC服务商解决相关问题。

2.最好准备2个服务器空间,他们存放的内容相同,而ip不同,并且机房的地理位置不同。这样2个区域的服务器, 能够做到有效异地容灾备份。发现宕机问题后,可以迅速的通过修改http://dnspod.com中的域名记录,指向目前正常的服务器。Dnspod解析生效的时间是实时的, 而一般的dns服务器,刷新时间较长,对外声称24小时内生效,按照实际经验看来,差不多30分钟内生效,否则就要检查域名绑定是否正确了。

1.什么是服务器宕机

可以简单的理解为死机.服务器是硬件设备.而且是全年二十四小时不间断运行的.通常负载量也较大.所以时间一长就容易出现宕机的情况.只要不是太频繁.就是完全正常的.一般常用服务器的人都知道.每隔一段时间定期手动重启下机器.对机器的性能有很大帮助.而且可以避免宕机的情况.毕竟服务器也是硬件.长期运行中间也应该有个喘气的过程.

2.服务器宕机的几种原因及解决办法

(1)客户端发出域名请求,形如xxx.com

这里可能出现的错误是,手工输入的域名网址错误。自然不能访问正确的网站了。这是最初级的错误,但还是容易发生的。要注意网址中,一些相近,或形似的字符,比如网址中 “1”与”l”,”0”与”o”,这些都是很容易混淆的字符。解决办法:认真审核一下网址,再次输入。或者百度一下,网址的核心关键字,或者品牌字,试一试。百度的结果,一般说来,还是比较准确的。

(2)通过dns服务器,将域名解析成对应的ip

这个步骤很关键,也是问题的高发期,40%的宕机,都是因为dns服务器不稳定造成的。Dns服务器,就像联系着姓名与电话号码的查询簿。这里如果出现问题,其后果是不堪设想的。因为一般的企业,和个人,多是选用网站空间建设网站,条件好一点的,也不过是租用或托管服务器。但是很少有人,拥有独立的dns服务器。80%的站长,都没有自已的dns服务器。大家的域名解析请求,一般通过域名商,提供的dns服务器完成。多对一,而这个服务的基数又是相当巨大的。当信息的洪流,集中到1-6台dns服务器上的时候,那么这几台dns服务器,就变的极不稳定了。

快速判定dns服务器故障的办法:

目前有一些网站,提供”IP反查”的功能。你需要找到一些,和你同ip的网站。可能因为更新有延时,有些域名的ip已经改变了。你需要再次ping一下选定的网址,确定该网站,和你的网站同属一个ip。把他们的网址记录下来。当你的网站不能打开的第一时间,你要登录同ip的网站看一看。如果,同ip下的其它网站,能打开,而唯独你的网站打不开。那就可以确定,是你网站的dns服务器,出现问题了。否则的话,那就要再进行下一步的故障排除。你也可以把,你的网站,和你同ip的网站,是否dns服务器故障,或是网站空间宕机故障了。

解决dns服务器不稳定的方法:

你可以选择一些专业的dns解析服务商,来解析你的域名。这些解析商,不但专业,而且也提供稳定而且免费的dns解析服务。在国内比较出名的dns解析商有:dnspod.com,dns.la,iidns.com等等…国外也有一些,不过推荐国内的服务。如果你的网站业务在国内,那么无论你的主机,还是dns服务器,都应该首选国内的机器。海外跨洋的线路,因为路途遥远,还有国家防火墙,等不可预知的因素较多,推荐国内的服务相对较稳定。在填写dns服务器列表的时候,也尽量将6个dns服务器,全部写上,比较稳妥。

(3)与ip对应的网站空间,或服务器做出响应

这个步骤,引起服务器宕机的概率在40%左右。这里故障的原因,就是服务器宕机了。一般站长,所指的宕机,也主要在这里。服务器当机的原因很多,流量过大,DDOS攻击,内部不稳定的程序,等等…

服务器宕机的判断方法:

同上一个步骤,如果同ip下的网站,都不能打开,那么基本上可以确定,是服务器宕机所致。

解决服务器宕机的方法:

a.要即时发现服务器宕机的问题。时间就是金钱,这是不变的真理。我们要第一时间,发现宕机的问题。如果他第一时间发现你的网站无法访问,他将立即发送Email通知站长。

b.最好准备2个网站空间,他们存放的内容相同,而ip不同,并且机房的地理位置不同。这样2个主机,同时宕机的可能性就大大降低了。第一时间发现宕机问题后,可以迅速的通过修改dnspod.com中的域名记录,指向目前正常的网站空间。Dnspod解析生效的时间是实时的,而一般的dns服务器,刷新时间较长,对外声称24小时内生效,按照实际经验看来,差不多30分钟内生效,否则就要检查域名绑定是否正确了。

c.可能仍有一些站长朋友,觉得域名解析有点复杂。想通了,其实很简单。别看他们的教程可能有一大段文字,其实就2个步骤:aa.在dns服务器上,将域名指向ip.bb.在网站空间上,将主机绑定域名(也是在这里,申请网站备案的!)。一个是,发送给谁?另一个是,接受谁的请求?是不是很简单呢?

(4)数据下载至本地网络,完成一次请求

这里出现问题的机率较小,不过也有可能。其表现的症状就是,在你的机器上不能访问你的网站。而在别人的电脑上,却是可以打开的。如果发生了这样的情况,那就可能是因为你所在地的网络不稳定,而造成的访问中断。这个故障,通常影响的区域较小。如果要确定,本地网络是否畅通,在打不开你的网站的时候,通过”在线代理”打开你的网站试一试。百度一下”在线代理”,有一些网站能提供,用其它的ip,或国外ip代理访问某个网站的服务。如果在线代理,能够打开你的网站,基本上可以确定,你所在的本地网络,出现了暂时的不稳定情况。

看了以上的介绍,大家也有了一定的了解了。电脑本身就是个负荷量大的东西,尤其是在使用较长一段时间之后,很容易出现各种各样的问题。但有些问题我们是可以从中找到原因的,并自己解决。相信服务器宕机的情况的很多人都经历过,稍微了解电脑的人看看以上的原因,就可以自己动手解决了,也不用再拿出去维修。

四,服务器故障排查方法总结

问题描述:

每当出现网站访问不了的时候,估计应该就是服务器出现故障了,这个时候大部分情况都是属于数据库出现问题。

查找步骤:

1、查找top检查服务器负载是否有问题

一般网站访问不了,top显示的负载都是很大的,这个时候可以看到mysql的进程占用资源很高,往往就是mysql发生故障了

2、在服务器中查看网站的访问记录

这些访问记录存储在:/home/对应的网站名/access-logs/对应的网站名

可以先通过tail查看,查看出异常的ip的时候可以通过grep进行过滤查看,在这个文件一般都可以找到恶意爬虫、恶意访问的记录,这些往往有可能是导致mysql数据库挂掉的原因。

3、这个时候先对数据库进行重启,对apache进行重启

service mysql restart

service httpd restart

重启之后一般都可以暂时恢复正常的访问的了。如果是出于恶意访问的话,找出恶意访问的ip把它禁止掉即可,如果是网站数据库出现故障,那么还要进行数据库排查。

4、查找数据库错误日志

首先需要知道数据库mysql的安装目录,可以通过whereis mysql找到,但是这往往没用

还有一种方法,就是通过ps -ef | grep mysql来查看

或者也可以通过进入mysql,使用select @@basedir as basePath from dual来查看mysql安装目录

我们在第二种查找方法ps -ef | grep mysql中对应mysql的几种日志找到其所在目录,然后查看对应文件进行分析

mysql有以下几种日志

错误日志:-log-err

查询日志:-log

慢查询日志:-log-slow-queries

更新日志:-log-update

二进制日志:-log-bin

以上便是对应的数据库错误日志和慢查询日志的查看方法了

在服务器的维修中,线索都会显得扑朔迷离,有的甚至按起葫芦翘起瓢。一般来说不可能一次就可以准确地判断出问题的所在。这样就要求工程师要有信心和耐心。出现错误一般的方法都是根据经验优先使用最简单排错方法测试,如果没有解决问题再找其它因素进行测试。总之,服务器出错后必须一步一步解决,没有捷径可言。

服务器如有出现卡顿的情况,就会影响游戏与网站的加载速度。一般情况下,用户访问网站或进游戏,业面如果长时间跳转不出,是不会继续等待,而是直接关闭。服务器稳定流畅的运行是至关重要的。造成服务器卡顿会的原因有很多,一般来说主要的是以下几个:

1.服务器中毒,服务器中毒服务器如果中毒的话,会导致服务器对外发包,耗尽带宽,造成卡顿。建议可以对服务器进行杀毒,清楚可疑文件

2.服务器访问量大,服务器如果访问量大,会造成带宽资源不足,带宽跑满占用过高造成线路拥堵,数据传输就会变得缓慢,建议可以升级带宽

3.服务器被CC攻击了,被CC攻击攻击者控制某些主机向目标受害服务器发出大量请求,从而达到消耗服务器资源的目的,连接数越多占用资源越大,就会造成网络拥堵。CC攻击的话,建议可以联系服务器商,进行调处CC防御策略

4.服务器硬件性能不足,服务器CPU占用高,内存跑满,也会造成服务器卡顿的情况,建议可以升级服务器的硬件配置

出现卡的情况时,为了技术能准确判断故障,请您做出下列判断

1、请先检查您的本地网络是否正常,若非本地网络问题,则可能是服务端故障。本地网络的检测方法:ping测试您的服务器,同时对其他一些网站进行同步ping测试,如果您的服务器丢包严重,其他的服务器没有丢包情况,则说明故障在您的服务器。

2、确认您的服务器有没有不卡的用户。通俗而言,全部用户卡,或部分用户卡。具体卡的用户是哪方面用户。

服务器故障是突发事件,没人能够预料的,只要加以防范和监控,注意以上出现的问题然后寻找到合适的解决方法就可以杜绝故障带来的损失。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/448908.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-06-01
下一篇2023-06-01

发表评论

登录后才能评论

评论列表(0条)

    保存