利用网络回溯分析技术解决某保险公司服务器未响应造成投资系统异常卡死问题
一、问题描述
通过了解得知,某保险公司投资系统测试服务器(AA.AA.67.19)需要与财务系统测试服务器(AA.AA.3.206)传输凭证,但是在数据传输时经常出现卡死的状况,不能进行正常的工作流程。
二、设备部署
通过科来网络回溯分析系统对投资系统异常进行分析,需监控投资服务器与财务服务器之间的链路,通过模拟正常的操作,抓取两台服务器之间的通讯数据进行分析。
三、分析过程
按照上述设备部署位置进行部署,模拟正常操作化抓取了全部的通讯数据,对其数据进行精细分析:
如上图,我们在这段时间进行操作,出现了传输第二个文件卡死的情况。
在这段时间内,两台服务器之间存在2个HTTP协议的会话(如上图)
上图为第一个HTTP会话的时序图,可以看出两台服务器能够正常的建立连接,正常的传输数据后正常关闭连接,为正常的会话通讯。
上图为第二次HTTP会话的时序图,两台服务器能够正常的建立连接,投资服务器(AA.AA.67.19)能够正常的向另一台服务器发送数据,财务服务器(AA.AA.3.206)在收到了投资服务器发送的数据之后再很短的时间内就回应了ACK数据包,确认收到了数据,但始终没有向投资服务器发送响应数据包,这就造成了用户感觉传输文件时出现卡死的情况。
四、分析结论
通过多次抓取出现故障时的数据包分析,每次结果均与上述描述一致。投资系统测试服务器(AA.AA.67.19)与财务系统测试服务器(AA.AA.3.206)之间的通讯卡死情况是由于财务服务器在收到投资服务器发送的数据后没有给对方发送响应造成,是财务服务器方面的原因,建议对财务服务器进行排查。
PS:保险公司服务器管理人员随后对财务服务器排查时发现财务系统日志已经被占满,清理日志后问题解决。
|