这是针对山东某学校的故障排查案例~众所周知,网络运行不稳定的因素有很多,排查的难度也很大。那么,针对此案例的情况又是应该如何做呢?我们来看看此篇文章的作者是如何做的!
测试前情况了解及分析方案确定
经了解,学校每周四下午都会出现网络大面积无法上网情况,以下为相关情况了解:
网络结构:出口为三条各100M的联通出口,8M教育网出口,之前通过radware做链路负载均衡,现在正在测试的array负载均衡,之后接入的是透明模式的防火墙,再接核心交换机。
故障描述:之前用radware时,经常出现不定时无缘由的个别机器无法上网,考虑此设备已经购买三四年,可能性能等问题,故现阶段一直测试的array链路负载均衡,不定时网络问题解决,但是出现了新现象,每周四下午固定的出现网络大面积无法上网,ping防火墙桥地址和链路负载均衡的内口地址时断时续,大量丢包,之前主干线路重新插拔后及恢复正常,现在重新插拔后仍不能恢复。其他时段上网基本正常,只是偶尔会出现无法上网的情况。经了解周四下午学校正常教学活动和平时一样,无特定的大流量的网络应用占用带宽。而且问题出现时,网络流量大约在80-90M左右,比正常时段150-230M流量低不少。
分析方案:经了解,由于radware和防火墙为多年前的设备,初步怀疑可能网络中连接数过多造成防火墙处理能力下降,进而故障出现时,ping防火墙桥地址丢包,引起网络故障,于是确定分析方案,核心交换机做端口镜像,同时在防火墙和array中间接入可网管交换机并做端口镜像,收集进入防火墙和出防火墙的数据包,通过查看包延迟来判断是否是防火墙处理性能问题。由于笔记本只有一个网卡,故首先接入到核心交换机的镜像口看网络中是否有问题。
下载:
网络不稳定故障排查.pdf
(738.56 KB, 下载次数: 147)
|