各位大佬们好,小弟最近经手了一个IDC建设项目,到了最后验收阶段发现了一个问题,简单描述为思科4507做了vss之后,在做备机的关机测试的时候发现内部服务器ping网关地址会丢16个包,之后恢复正常(服务器的网关在4507上),拓扑图如下:(其中FG800C防火墙可以忽略不用管,N3K做的vpc模式)
我分别做了如下的测试(N3K下面有一台服务器一直ping着网关地址,网关地址在4507上):
测试1:当前4507 VSS状态为左边为主,右边为备,关闭左边的4507,从服务器上看到会丢一个包,属于正常情况。
测试2:当前4507 VSS状态为右边为主,左边为备,关闭右边的4507,从服务器上看到会丢16个包左右。
测试3:当前4507 VSS 状态为左边是主,右边为备,关闭右边的4507,从服务器上同样会看到会丢16个包左右。
以下为TAC的回应,我觉得分析的完全不到位:
导致VSS切换丢包原因: 1. 在切换时备用引擎接管出现问题导致设备丢包。 2. 4500下联N3K接口使用port channel 如果port channel 在VSS切换时,哈希数据流出现不匹配会导致VSS切换时引擎正常已经接管,但是网络无法进行快速切换 。 a. port channel会将相同的源IP地址哈希到一个物理接口上进行数据转发,如果在做VSS切换时port channel没有感知到引擎已经切换会出现丢包的问题。
为了证明不是TAC所说的是VSS 的切换导致N3K和4507的协商问题我做了测试4:
测试4:当前我排除了N3K的存在,在我们外网防火墙有做和另外一个地方的IPSEC VPN连接,在VPN另外一端我做了同样的测试,结果和测试1、2、3一样,这样是否就排除了N3K的问题。
以上是小弟遇到的问题,请大佬们帮忙分析分析,不胜感激!
|