服务器宕机是每个服务商都会遇到的问题,一般有以下几种原因:
1.服务器性能
服务器的性能问题有很多,但最多见的应该就是SQL,但我们也不能一概而论,还有别的可能性,例如有些问题就是服务器Bug或错误行为导致的。另外,较差的Schema和索引设计也是较多的出错原因之一。
2.运行环境
如果是这个问题,那么最常见的就是磁盘空间消耗完了。
3.数据丢了或损坏
数据丢失也有很多原因,可能不是用户错误操作,也可能是人为攻击造成的,但一般来说是由drop table错误操作导致,通常出现这个问题都会伴随着缺少可用备份的问题。
4.复制
复制问题一般是由主备数据不一致导致的。
我们了解了这几项宕机原因,那么如何判断或查看服务器宕机原因呢?
(1)查看是否是误操作导致的
(2)查看是否是应用程序导致的
(3)查看是否是应用程序导致内存溢出或者泄露,out of memory导致
(4)查看是否是流量负载过大导致的
(5)查看是否是遭受黑客入侵攻击导致的
那我们查明是如原因后,我们又该如何去解决问题呢?
1.发现服务器宕机后,及时联系服务商解决相关问题,就算短暂的宕机也可能会造成较大的损失,请大家及时联系自己的服务商。
2.做好提前防范的准备。可以同时运行两个网站空间,备份内容,当一个出现问题,立刻启动另一个。
3.使用一款功能好的宕机监控第一时间智能处理,故障发生时可设置自动切换至备用IP,恢复后将切换回原IP,能够有效提高网站可用性和页面性能。有效规避风险降低成本。
说说我以前最常用的三种批量部署方案(有疑问接受私信):
第一:服务器一般都会用两块磁盘做RAID1作为系统盘,手动安装完第一台操作系统,RAID1的功能是两块盘中具有相等的数据,所以两块盘都存在了刚刚安装好的linux系统,拔出一块系统盘(服务器认为你这块盘坏了),再插入一块新盘到刚刚拔出磁盘的位置,此时服务器会再次向新磁盘自动同步数据,保持1:1备份。接下来刚刚拔出的那块系统盘派上用场,把刚刚扒出来的那块有系统的盘插到另外一台无系统的服务器上,自动完成与另外一块盘的同步,以此类推,1生2,2生4,4生8,8生16,16生32
第二种:刻录无人值守光盘
第三种:PXE批量部署
PXE实例:
我3年前做过一套PXE部署系统(以下是当时用于机房部署系统的截图界面)。可以部署windows+linux的各个版本,部署服务器采用的windows系统(因为windows能通过easybcd制作syslinux引导),syslinux就可以成功引导起win和linux,引导成功后,调用kickstart制作的linux无人应答文件,wds &AKT制作的windows无人应答文件,完成系统安装。你的需求只需要安装统一的linux版本,所以相对来说比较容易,花两天学习下kickstart基本就能在虚拟机上实践成功,但是如果要应用到物理服务器,还需要考虑驱动,raid,格式化等问题
解决办法当然是PXE+Kickstart了,学会一次就能一直用很方便。
你需要准备:
1、交换机,用于连接Server和客户机(必须临时关闭DHCP)
2、部署用server主机(由此台主机接管DHCP服务)
3、其他一堆客户机(需要调节至PXE引导模式)
然后按照教程
https://andyx.net/pxe_kickstart_automatic_deployment_of_linux_system/对Server
主机进行部署PXE+Kickstart,完成之后客户端开机即可自动安装。
没有部署同时过100多台,但是曾经部署26台ECS集群,支撑1500左右tps。部署的方案是:阿里云ECS+镜像+弹性伸缩+负载均衡。开发测试环境用的是Vagrant直接控制多台虚拟机,曾经也使用过VMware ESXi和VMware VCenter管理虚拟机集群
腾讯有个蓝鲸平台,只需要录入你的服务器ip就可以批量操作。
还有一个ansible的来源运维工具。
还可以通过pexpect脚本,自己用python结合ssh搭建一个运维平台。
如果是批量买机器的话,各个云厂商都提供有接口,写个简单都shell就可以了。
阿里云前天刚发布的,叫什么servicefee,忘了,可视化部署,一键拉起,可设置拉起顺序,定时弹性容灾,服务之间的调用可视化,其他数据也是可监控
会 python 和 shell 可以搞搞 fabric ,我在用,还不错!
看你部署应用还是系统,平台是什么。
系统简单,做个模板机,复制就行了。
应用也不麻烦,跟上边的一样做个镜像就行,或者用批量管理工具ansible salt 这类的工具。云服务器的话,镜像市场也有公用的。
ansible,puppet和chef是常用的自动化运维工具。你说的需求用这三个都能做
1.部署操作系统,制作系统模板,批量创建或调用api接口即可
2.部署应用软件,可使用自动化工具如ansible或者编写脚本来批量部署
linux有类似ghost那样的克隆工具,推荐clonezilla。ghost for Linux也可以。
另外,Linux下的dd命令可以完成一个源驱动器对目标驱动器的镜像操作。
进游戏后,按F10,查看NAT类型,open最佳,M其次,S最次,也就是说open可以和所有NAT类型玩耍,M只能同open和M玩耍,S只能和open玩耍。
然后打开路由器设置的网页,192.168.1.1或者192.168.0.1。我们找到UPNP这个路由设置选项,将他打开。然后找到DMZ选项打开,并输入你电脑的本地IP地址。就这样就完了。
通过以上设置,延迟一般在100左右,国内联机都在60左右,组队都是优于平均延迟。一般电信,联通都可以是open类型,如果你是电信联通但是NAT为M,我们可以通过设置路由器。
还有一种更便捷的解决方法就是使用网络加速器,前提是只能连接亚洲服务器,这样可以有效避免出现连接BUG。
或者更改一下我们的网络host,打开C:WindowsSystem32driversetc文件夹,找到hosts文件,用记事本格式打开。
用以下host地址覆盖原本的:
103.86.70.254 r6statuspc.azureedge.net
103.86.70.254 r6pcaddons.azureedge.net
103.86.70.254 msr-public-ubiservices.ubi.com
103.86.70.254 api-discovery.live01.pc-live.r6.ubi.com
103.86.70.254 api-configuration-live01.live01.pc-live.r6.ubi.com
103.86.70.254 r6logstorage05.blob.core.windows.net
103.86.70.254 public-ubiservices.ubi.com
103.86.70.254 public-ws-ubiservices.ubi.com
复制完毕后点击保存。
重新试一下,即可连接。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)