看你下边那句话 应该是第二者 做一个日常的维护方案
服务器的维护可以分为硬件维护和软件维护两种,硬件维护比较简单,主要是保证机房的温湿度,做好防尘防火,定时更换硬件设备等,而软件维护又包括对操作系统的维护和对主机上所跑应用的维护,这一部分是比较难的,需要对操作系统、应用软件系统有比较深入的认识和了解。
操作系统是服务器运行的软件基础,其重要性不言自明。如果服务器操作系统使用Windows 2003或Windows 2000 Server作为操作系统,维护起来还是比较容易的,只要按时打好补丁,订时查看日志就可以。但是如果是LINUX和UNIX操作系统的话,需要对管理员的技术有相当高的要求,需要管理员具备一定的专业知识。
服务器上的应用维护
服务器上的应用软件都是运行的企业的核心数据,是企业的最重要的数据之一,不容出错,如果数据出现丢失或者服务停止的话对于企业来说是致命的, 企业的应用已经成了企业生存和发展的重要组成部分,应用是企业核心业务的血液,当企业应用的规模越来越大时,应用也随之越来越多,如何迅速有效的对这些关键应用进监控就成为了迫切棘手的问题。
7*24小时不间断
除了上述二点列出的技术上的困难之外,还有一个重要的问题就是企业的服务器及上面所跑的应用都是实时性很高的业务,必须得保证7*24小时不间断,单纯的管理员维护的话实时性太差,管理员不可以一天二十四小时盯着服务器,所以现实中经常出现服务器出现Down机或者服务器上的应用出了问题,管理员往往不能第一时间知道,往往都是实际使用服务器或都应用的人去通知管理员,这时业务可能已经停了好长时间,这对于企业来说无疑是很大的损失。
服务器维护的解决方案
通过上面的分析,通过管理员对服务器和上面的应用进行管理维护是行不通的也是非常危险的,所以目前大多数企业都是通过服务器监控软件维护服务器为主,管理员维护为辅的管理方式。
同时企业又面对另一个问题,什么样的服务器监控软件才是好的,笔者认为一款好的服务器监控软件应该具备以下几点:
1.监控可视化,界面友好,用户可以在一个界面对服务器的健康情况一目了然。
2.可以对服务器的可用性,性能,组件进行监控,包括CPU,内存,硬盘,分区,接口等等。
3.操作简单,不需要太专业的知识也可以维护。
4.如果服务器出现问题可以通过多种方式进行告警,包括邮件,短信,语音,客户端等。可以使管理员第一时间知道情况进行解决。
5.报表功能完善,可以进行趋势分析和性能分析,帮助企业的管理层作出决策并提供有力的证据。
总结
从用过的网管软件来看,Mocha BSM是一款比较专业比较实用的服务器监控软件,通过摩卡业务服务管理(Mocha BSM)可以有效的对服务器和上面的应用进行监控,使服务器健康稳定运行,最大化的为企业服务,同时还可以解放人力,节约企业成本,提高企业的信息化水平。
四,服务器故障排查方法总结
问题描述:
每当出现网站访问不了的时候,估计应该就是服务器出现故障了,这个时候大部分情况都是属于数据库出现问题。
查找步骤:
1、查找top检查服务器负载是否有问题
一般网站访问不了,top显示的负载都是很大的,这个时候可以看到mysql的进程占用资源很高,往往就是mysql发生故障了
2、在服务器中查看网站的访问记录
这些访问记录存储在:/home/对应的网站名/access-logs/对应的网站名
可以先通过tail查看,查看出异常的ip的时候可以通过grep进行过滤查看,在这个文件一般都可以找到恶意爬虫、恶意访问的记录,这些往往有可能是导致mysql数据库挂掉的原因。
3、这个时候先对数据库进行重启,对apache进行重启
service mysql restart
service httpd restart
重启之后一般都可以暂时恢复正常的访问的了。如果是出于恶意访问的话,找出恶意访问的ip把它禁止掉即可,如果是网站数据库出现故障,那么还要进行数据库排查。
4、查找数据库错误日志
首先需要知道数据库mysql的安装目录,可以通过whereis mysql找到,但是这往往没用
还有一种方法,就是通过ps -ef | grep mysql来查看
或者也可以通过进入mysql,使用select @@basedir as basePath from dual来查看mysql安装目录
我们在第二种查找方法ps -ef | grep mysql中对应mysql的几种日志找到其所在目录,然后查看对应文件进行分析
mysql有以下几种日志
错误日志:-log-err
查询日志:-log
慢查询日志:-log-slow-queries
更新日志:-log-update
二进制日志:-log-bin
以上便是对应的数据库错误日志和慢查询日志的查看方法了
在服务器的维修中,线索都会显得扑朔迷离,有的甚至按起葫芦翘起瓢。一般来说不可能一次就可以准确地判断出问题的所在。这样就要求工程师要有信心和耐心。出现错误一般的方法都是根据经验优先使用最简单排错方法测试,如果没有解决问题再找其它因素进行测试。总之,服务器出错后必须一步一步解决,没有捷径可言。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)