机房内网丢包问题排查方法

机房内网丢包问题排查方法,第1张

机房内网丢包问题排查方法

运维工作中,最烦人的就是网络丢包,线上无小事,每一步操作都有可能带来严重的后果,多以当线上机房出现内网丢包时,改如何去合理应对:

首先要做的就是,确定丢包范围,判断是否对业务有影响,通知dev并确认影响范围

如果影响严重,则需要与dev商量考虑是否需要进行流量迁移

如果影响较小,处于可容忍值以内,在排查问题时需时刻关注是否故障范围有扩大现象,以便及时作出调整

其次才是故障排查

如果发现只有一台机器丢包明显,并且无论什么时候都有丢包现象

很可能是这台机器本身的问题,通过messages日志查看是不是系统原因

如果确定不是系统故障,则很有可能是硬件故障或网线松动的问题

如果发现相同类型机器都有类似丢包现象,而其他不同类型机器则没有该现象

很有可能是该网段网络质量问题,需要查看这些机器是否在同一网段并联系网络组追查

如果机器都不在同一网段,此时很有可能是上下游业务机器的连通性有问题,查看业务日志,检查是否这些机器在连接某一台或一个网段的上下游机器出现问题,顺蔓摸瓜,找到问题根源

扩展知识-机房怎么建立局域网

一般机房会有光纤接入到路由设备上,而路由设备下面的所有交换机和计算机等即组成了一个局域网,局域网只是区别外网的,所以在机房配置好交换机及计算机之后,局域网就算完成了。

局域网(Local Area Network,LAN)是指在某一区域内由多台计算机互联成的计算机组。一般是方圆几千米以内。局域网可以实现文件管理、应用软件共享、打印机共享、工作组内的日程安排、电子邮件和传真通信服务等功能。局域网是封闭型的,可以由办公室内的两台计算机组成,也可以由一个公司内的上千台计算机组成。

局域网(Local Area Network,LAN)是在一个局部的地理范围内(如一个学校、工厂和机关内),一般是方圆几千米以内,将各种计算机,外部设备和数据库等互相联接起来组成的`计算机通信网。它可以通过数据通信网或专用数据电路,与远方的局域网、数据库或处理中心相连接,构成一个较大范围的信息处理系统。局域网可以实现文件管理、应用软件共享、打印机共享、扫描仪共享、工作组内的日程安排、电子邮件和传真通信服务等功能。局域网严格意义上是封闭型的。它可以由办公室内几台甚至上千上万台计算机组成。决定局域网的主要技术要素为:网络拓扑,传输介质与介质访问控制方法。

局域网由网络硬件(包括网络服务器、网络工作站、网络打印机、网卡、网络互联设备等)和网络传输介质,以及网络软件所组成。

1、本地网络故障:可以用户本身可以进行解决,先查看是什么原因导致的本地网络故障。有部分情况是因为管理员账号被黑,然后被大量的发送数据包,导致的网络堵塞,进而导致服务器丢包。

2、中转网络故障:中转网络故障具体指的是,访问服务器跳出本地路由直到跟机房核心交换,在这中间的路由网络。中转网络故障非常难以判断,无论是用户还是机房人员,都没办法直接进行干预操作,好在中转网络故障会自行恢复,一般也不要等待太长时间。

3、机房网络故障:机房网络故障的形成原因是机房硬件设备故障跟自然灾害。机房网络故障是相对常见的原因,特别是高防服务器机房,因为可以抵挡各种流量的网络攻击,因而有时会被攻击导致出现丢包的情况。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/58497.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-02-27
下一篇2023-02-27

发表评论

登录后才能评论

评论列表(0条)

    保存