服务器宕机是每个服务商都会遇到的问题,一般有以下几种原因:
1.服务器性能
服务器的性能问题有很多,但最多见的应该就是SQL,但我们也不能一概而论,还有别的可能性,例如有些问题就是服务器Bug或错误行为导致的。另外,较差的Schema和索引设计也是较多的出错原因之一。
2.运行环境
如果是这个问题,那么最常见的就是磁盘空间消耗完了。
3.数据丢了或损坏
数据丢失也有很多原因,可能不是用户错误操作,也可能是人为攻击造成的,但一般来说是由drop table错误操作导致,通常出现这个问题都会伴随着缺少可用备份的问题。
4.复制
复制问题一般是由主备数据不一致导致的。
我们了解了这几项宕机原因,那么如何判断或查看服务器宕机原因呢?
(1)查看是否是误操作导致的
(2)查看是否是应用程序导致的
(3)查看是否是应用程序导致内存溢出或者泄露,out of memory导致
(4)查看是否是流量负载过大导致的
(5)查看是否是遭受黑客入侵攻击导致的
那我们查明是如原因后,我们又该如何去解决问题呢?
1.发现服务器宕机后,及时联系服务商解决相关问题,就算短暂的宕机也可能会造成较大的损失,请大家及时联系自己的服务商。
2.做好提前防范的准备。可以同时运行两个网站空间,备份内容,当一个出现问题,立刻启动另一个。
3.使用一款功能好的宕机监控第一时间智能处理,故障发生时可设置自动切换至备用IP,恢复后将切换回原IP,能够有效提高网站可用性和页面性能。有效规避风险降低成本。
—、服务器出现宕机的原因1.运行环境出现问题,机房断电导致的服务器断电(欠压,过载,波动)、机房温度过高,散热不良、资源冲突、DirectX文件的损坏、系统不完善等等原因而造成服务器宕机。
⒉.服务器不堪负重,最常见的如磁盘空间耗尽、访问值过大、程序中毒、遭受攻击等大规模高消耗服务器资源情况。
3.由于主备数据不—致导致的复制问题。
4.性能问题,运维运行糟糕的SQL或Schema和索引设计等。
二、服务器宕机应该从哪些方面检查呢?
①硬件
(1)检查硬件是否有冲突
(2)对比服务器电源所负载的功率判断电源是否出现故障
(3)扫描硬盘表面检查是否有坏道
(4)通过错误报告和操作系统的报错信息来判断
(5)使用替换法判断主板、CPU、SCSI/RAID卡或其他PCI设备是否出现故障。
②软件
(1)检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因
(2)在判断硬件没有故障后,考虑系统软件的BUG和漏洞原因
(3)如果是因为软件使用不当或系统工作压力过大,可以适当降低服务器的工作压力
(4)电脑病毒。
以上就是有关服务器宕机的原因有哪些,应该从哪些方面检查的知识介绍。
在想解决处理办法之前要知道服务器宕机的两种形态:假死机和死机
假死机(非蓝屏死机)是由于硬件资源暂时性地被消耗殆尽,因而无法对外部指令进行响应的现象, 通常是网站处于访问高峰期,带宽等资源跑满,这时只需要等待一定的时间,待服务器腾出更多的硬件资源即可恢复正常。
而死机,如果通过ping测试服务器,键盘切换数字锁定键(NumLock)或大写锁定键(Caps Lock)功能, 显示器无画面输出,或者鼠标光标没有任何反应则表明服务器硬件故障。
再了解服务器出现宕机的常见原因 :
1.在运行环境的问题中,最普遍的问题时磁盘空间耗尽。
2.在性能问题中,最普通的服务器宕机原因确实是运行很糟糕的SQL, 但也不一定都是这个原因,比如也有很多问题是由于服务器Bug或错误的行为导致的。
3.糟糕的Schema和索引设计是第二大影响性能的问题。
4.复制问题通常由于主备数据不一致导致。
5.数据丢失问题通常由于drop table的错误操作导致,并总是便随着缺少可用备份的问题。
如何查看服务器宕机的原因:
a、是否是应用程序导致内存溢出或者泄露,out of memory导致
b、是否是进程过多或者不断创建,耗尽资源导致
c、是否是数据库程序死锁,连接数过多导致
d、是否是应用程序异常导致
e、是否是流量负载过大导致
f、 是否是遭受黑客入侵攻击导致
g、是否是误操作导致
服务器宕机自行解决办法:
1.要即时发现服务器宕机的问题。时间就是金钱,这是不变的真理。我们要第一时间, 发现宕机的问题,服务器宕机时,为了避免造成不必要的损失,要尽早通知IDC服务商解决相关问题。
2.最好准备2个服务器空间,他们存放的内容相同,而ip不同,并且机房的地理位置不同。这样2个区域的服务器, 能够做到有效异地容灾备份。发现宕机问题后,可以迅速的通过修改http://dnspod.com中的域名记录,指向目前正常的服务器。Dnspod解析生效的时间是实时的, 而一般的dns服务器,刷新时间较长,对外声称24小时内生效,按照实际经验看来,差不多30分钟内生效,否则就要检查域名绑定是否正确了。
1.什么是服务器宕机
可以简单的理解为死机.服务器是硬件设备.而且是全年二十四小时不间断运行的.通常负载量也较大.所以时间一长就容易出现宕机的情况.只要不是太频繁.就是完全正常的.一般常用服务器的人都知道.每隔一段时间定期手动重启下机器.对机器的性能有很大帮助.而且可以避免宕机的情况.毕竟服务器也是硬件.长期运行中间也应该有个喘气的过程.
2.服务器宕机的几种原因及解决办法
(1)客户端发出域名请求,形如xxx.com
这里可能出现的错误是,手工输入的域名网址错误。自然不能访问正确的网站了。这是最初级的错误,但还是容易发生的。要注意网址中,一些相近,或形似的字符,比如网址中 “1”与”l”,”0”与”o”,这些都是很容易混淆的字符。解决办法:认真审核一下网址,再次输入。或者百度一下,网址的核心关键字,或者品牌字,试一试。百度的结果,一般说来,还是比较准确的。
(2)通过dns服务器,将域名解析成对应的ip
这个步骤很关键,也是问题的高发期,40%的宕机,都是因为dns服务器不稳定造成的。Dns服务器,就像联系着姓名与电话号码的查询簿。这里如果出现问题,其后果是不堪设想的。因为一般的企业,和个人,多是选用网站空间建设网站,条件好一点的,也不过是租用或托管服务器。但是很少有人,拥有独立的dns服务器。80%的站长,都没有自已的dns服务器。大家的域名解析请求,一般通过域名商,提供的dns服务器完成。多对一,而这个服务的基数又是相当巨大的。当信息的洪流,集中到1-6台dns服务器上的时候,那么这几台dns服务器,就变的极不稳定了。
快速判定dns服务器故障的办法:
目前有一些网站,提供”IP反查”的功能。你需要找到一些,和你同ip的网站。可能因为更新有延时,有些域名的ip已经改变了。你需要再次ping一下选定的网址,确定该网站,和你的网站同属一个ip。把他们的网址记录下来。当你的网站不能打开的第一时间,你要登录同ip的网站看一看。如果,同ip下的其它网站,能打开,而唯独你的网站打不开。那就可以确定,是你网站的dns服务器,出现问题了。否则的话,那就要再进行下一步的故障排除。你也可以把,你的网站,和你同ip的网站,是否dns服务器故障,或是网站空间宕机故障了。
解决dns服务器不稳定的方法:
你可以选择一些专业的dns解析服务商,来解析你的域名。这些解析商,不但专业,而且也提供稳定而且免费的dns解析服务。在国内比较出名的dns解析商有:dnspod.com,dns.la,iidns.com等等…国外也有一些,不过推荐国内的服务。如果你的网站业务在国内,那么无论你的主机,还是dns服务器,都应该首选国内的机器。海外跨洋的线路,因为路途遥远,还有国家防火墙,等不可预知的因素较多,推荐国内的服务相对较稳定。在填写dns服务器列表的时候,也尽量将6个dns服务器,全部写上,比较稳妥。
(3)与ip对应的网站空间,或服务器做出响应
这个步骤,引起服务器宕机的概率在40%左右。这里故障的原因,就是服务器宕机了。一般站长,所指的宕机,也主要在这里。服务器当机的原因很多,流量过大,DDOS攻击,内部不稳定的程序,等等…
服务器宕机的判断方法:
同上一个步骤,如果同ip下的网站,都不能打开,那么基本上可以确定,是服务器宕机所致。
解决服务器宕机的方法:
a.要即时发现服务器宕机的问题。时间就是金钱,这是不变的真理。我们要第一时间,发现宕机的问题。如果他第一时间发现你的网站无法访问,他将立即发送Email通知站长。
b.最好准备2个网站空间,他们存放的内容相同,而ip不同,并且机房的地理位置不同。这样2个主机,同时宕机的可能性就大大降低了。第一时间发现宕机问题后,可以迅速的通过修改dnspod.com中的域名记录,指向目前正常的网站空间。Dnspod解析生效的时间是实时的,而一般的dns服务器,刷新时间较长,对外声称24小时内生效,按照实际经验看来,差不多30分钟内生效,否则就要检查域名绑定是否正确了。
c.可能仍有一些站长朋友,觉得域名解析有点复杂。想通了,其实很简单。别看他们的教程可能有一大段文字,其实就2个步骤:aa.在dns服务器上,将域名指向ip.bb.在网站空间上,将主机绑定域名(也是在这里,申请网站备案的!)。一个是,发送给谁?另一个是,接受谁的请求?是不是很简单呢?
(4)数据下载至本地网络,完成一次请求
这里出现问题的机率较小,不过也有可能。其表现的症状就是,在你的机器上不能访问你的网站。而在别人的电脑上,却是可以打开的。如果发生了这样的情况,那就可能是因为你所在地的网络不稳定,而造成的访问中断。这个故障,通常影响的区域较小。如果要确定,本地网络是否畅通,在打不开你的网站的时候,通过”在线代理”打开你的网站试一试。百度一下”在线代理”,有一些网站能提供,用其它的ip,或国外ip代理访问某个网站的服务。如果在线代理,能够打开你的网站,基本上可以确定,你所在的本地网络,出现了暂时的不稳定情况。
看了以上的介绍,大家也有了一定的了解了。电脑本身就是个负荷量大的东西,尤其是在使用较长一段时间之后,很容易出现各种各样的问题。但有些问题我们是可以从中找到原因的,并自己解决。相信服务器宕机的情况的很多人都经历过,稍微了解电脑的人看看以上的原因,就可以自己动手解决了,也不用再拿出去维修。
昨日携程旅行网站打不开服务器故障,相信大家也看到携程科技大楼彻夜明灯加紧整修的壮观场景,那么对于服务器宕机怎么办?本文小编就来教一下大家服务器故障应急预案。首先分清导致服务器出故障的因素:
1、外部攻击
2、内部攻击
3、运维误操作
服务器宕机怎么办?服务器故障应急预案
不管是外部攻击还是内部故障,备份好以及冗余措施,可以使宕机时间缩短到最低。
备份问题尽管听起来不可思议,但在实践中,不少企业并未建立起一套检验过的备份系统。备份的意义在于危急时刻可以快速恢复或重建生产系统。在企业网络中,经常出现的问题实际上是:
备份步骤的瑕疵导致并未完成正确的备份过程
由于有限的存储空间导致一定时间后因存储空间耗尽导致的随后备份失败
备份介质受损导致无法成功恢复
传统上,磁带因其低造价以及高存储密度使其成为了理想的备份介质。然而,这种传统备份介质的几个致命缺点经常使其内含的数据变得不可存取:
丢失的磁带索引卡片
磁带介质在存储过程中容易受到外界磁场影响
介质本身损坏
介质读取过程中被读取设备损坏
此外,磁带备份介质本身存储在磁带仓库中,从仓库检索所需的备份磁带、转移至数据中心并重新加载数据的时间消耗通常也是客观的。
即使有一套备份系统仍然是不能抵挡所有的意外事故的。2014 年, Samsung 数据中心的一场大火使其云服务暂停服务。如果没有异地备份,这场大火将使其本地备份的恢复变得极为困难。
冗余对于突发性事件来说,尽快恢复,或者是持续的提供服务是非常重要的。本月,某知名支付公司因数据中心网络连接性故障导致了一段时间的服务中断。如果有更好的冗余方案,此种事故的影响面将会得以降低,甚至会化解为用户不可感知的内部事故。
大部分服务器都有两部独立的 PSU,任意一部 PSU失效并不会影响其正常服务一般来说,服务器的两部 PSU 将连接到两路不同的电路或不间断电源上以避免市电失效数据中心电源多数同时配备 UPS 和柴油发电机来避免发电公司未通知的停止供电服务导致的服务中断。网络亦然同时接入多路 ISP 线路,并对其进行独立布线,同时在多条线路上宣告地址,便可使得网络服务的鲁棒性更高。
在系统的视角上,只有同时配置好的备份以及冗余方案,才能提高可用性,避免非可控因素导致的长时间服务中断。
服务器宕机怎么办?服务器故障应急预案就为大家介绍到这里
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)