NFS服务器故障排错日记

NFS服务器故障排错日记,第1张

1.问题场景:

周末回来第一天上班,发现服务器被重启了,但是nfs文件挂载出现问题。具体表现如下:

1)在nfs客户端,挂载目录下不能ls或者ll;

2)输入strace dh -f 后,文件挂载状况不能全部显示,在某个挂载目录终止了。

2.解决问题的方法:

1)重启nfs服务器的服务(先启动rpcbind再启动nfs)

service rpcbind start(启动nfs服务)

service nfs start

2)查看nfs启动状态

# service rpcbind status

# service nfs status 

3) 查看nfs服务器上的可挂载共享目录

# showmount -e localhost//默认查看自己共享的服务

4)在客户端启动rpc

# service rpcbind start

5)在客户端安装nfs相关软件,使用yast2

# yast2

6)在客户端查看服务器的可挂载目录

#showmount -e 服务器IP/域名

7)在客户端手动mount挂载

 mount 192.168.1.108:/opt/centos6/ /app/web/labs/nfs/

8)问题解决,共享目录挂载到客户端上

注意:1)nfs是依靠rpc来实现文件共享,所以启动服务的时候要先启动rpc,再启动nfs;

            2)nfs网路文件共享,需要先验证网络是否通畅,如果客户端与nfs服务器不通,nfs不生效。

            3)启动自动挂载nfs文件系统,在启动nfs服务的时候会自动加载/etc/fstab中的内容,如果有nfs相关,则自动挂载。

            # vi /etc/fstab

            格式:

            <server>:</remote/export></local/directory>nfs <options>0 0

            4)服务端口查看netstat

            5)测试挂载状况

               # strace df -h

            以上就是我nfs服务器挂掉后,重启、排查故障的相关内容,分享给大家

            

四,服务器故障排查方法总结

问题描述:

每当出现网站访问不了的时候,估计应该就是服务器出现故障了,这个时候大部分情况都是属于数据库出现问题。

查找步骤:

1、查找top检查服务器负载是否有问题

一般网站访问不了,top显示的负载都是很大的,这个时候可以看到mysql的进程占用资源很高,往往就是mysql发生故障了

2、在服务器中查看网站的访问记录

这些访问记录存储在:/home/对应的网站名/access-logs/对应的网站名

可以先通过tail查看,查看出异常的ip的时候可以通过grep进行过滤查看,在这个文件一般都可以找到恶意爬虫、恶意访问的记录,这些往往有可能是导致mysql数据库挂掉的原因。

3、这个时候先对数据库进行重启,对apache进行重启

service mysql restart

service httpd restart

重启之后一般都可以暂时恢复正常的访问的了。如果是出于恶意访问的话,找出恶意访问的ip把它禁止掉即可,如果是网站数据库出现故障,那么还要进行数据库排查。

4、查找数据库错误日志

首先需要知道数据库mysql的安装目录,可以通过whereis mysql找到,但是这往往没用

还有一种方法,就是通过ps -ef | grep mysql来查看

或者也可以通过进入mysql,使用select @@basedir as basePath from dual来查看mysql安装目录

我们在第二种查找方法ps -ef | grep mysql中对应mysql的几种日志找到其所在目录,然后查看对应文件进行分析

mysql有以下几种日志

错误日志:-log-err

查询日志:-log

慢查询日志:-log-slow-queries

更新日志:-log-update

二进制日志:-log-bin

以上便是对应的数据库错误日志和慢查询日志的查看方法了

在服务器的维修中,线索都会显得扑朔迷离,有的甚至按起葫芦翘起瓢。一般来说不可能一次就可以准确地判断出问题的所在。这样就要求工程师要有信心和耐心。出现错误一般的方法都是根据经验优先使用最简单排错方法测试,如果没有解决问题再找其它因素进行测试。总之,服务器出错后必须一步一步解决,没有捷径可言。

1、Ping命令

ping是个使用频率极高的实用程序,主要用于确定网络的连通性。这对确定网络是否正确连接,以及网络连接的状况十分有用。简单的说,ping就是一个测试程序,如果ping运行正确,大体上就可以排除网络访问层、网卡、Modem的输入输出线路、电缆和路由器等存在的故障,从而缩小问题的范围。

2、Ipconfig命令

ipconfig实用程序可用于显示当前的TCP/IP配置的设置值。这些信息一般用来检验人工配置的TCP/IP设置是否正确。使用ipconfig命令可以了解到你的计算机是否成功地租用到了一个IP地址,如果已经租用到,则可以了解它目前得到的是什么地址,包括IP地址、子网掩码和缺省网关等网络配置信息。

3、Tracert命令

Tracert命令用来显示数据包到达目标主机所经过的路径,并显示到达每个节点的时间。命令功能同Ping类似,但它所获得的信息要比Ping命令详细得多,它把数据包所走的全部路径、节点的IP以及花费的时间都显示出来。该命令比较适用于大型网络。

4、Netstat命令

Netstat命令帮助网络管理员了解整个网络的使用情况。它可以显示当前活动网络连接的详细信息,如网络连接、路由表和网络接口信息,还可以计算当前运行的网络连接总数。

5、renew命令

使用Renew时,使用DHCP的计算机上的所有网卡(手动配置的适配器除外)都尝试连接到DHCP服务器,以更新现有的配置或获得一个新的配置。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/121796.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-03-14
下一篇2023-03-14

发表评论

登录后才能评论

评论列表(0条)

    保存