设为首页收藏本站language 语言切换
查看: 3006|回复: 6
收起左侧

[书籍] IP流性能测量IP FPM详解

[复制链接]
 成长值: 65015
发表于 2021-7-21 10:15:49 | 显示全部楼层 |阅读模式
IP FPM简介
介绍IP FPM的定义、目的和受益。

定义
IP流性能测量IP FPM(IP Flow Performance Measurement)是一种基于端到端,直接对业务报文进行测量,从而得到IP网络的真实丢包率、时延等性能指标的检测方式,具有部署方便、统计精度高等突出优点。

目的
随着网络IP化时代的到来,端到端业务的性能故障诊断和性能质量评价成为越来越突出的问题。端到端业务的性能故障诊断缺乏有效的端到端定位手段,导致其性能故障诊断时间长、难度大。在IPRAN网络、国家宽带等地方,运营商迫切希望能对运行在承载网上的业务进行定量的质量度量。为了满足运营商对网络性能实施监控和统计的需求,现网中通常采用部署网络质量分析NQA(Network Quality Analysis)的方式来实现。

但是,由于存在如下问题,NQA不能完成三层网络端到端的性能统计:
NQA是根据统计实例的类型,构造报文进行网络性能的统计,通过统计构造报文的丢包率来间接模拟业务报文的丢包率。因此,NQA统计得到的性能指标存在精度上的差距,不能直接体现用户的真实业务在网络中的运行状况,也不能直接作为分析网络性能的依据。
NQA不支持跨网络层端到端的场景,不能很好地解决IP网络在多路径场景下,网络性能难以监控和统计的问题。
IP FPM是一种通用的IP网络性能检测的方案,可以有效地解决上述问题。一方面,IP FPM可以直接对业务报文进行测量,测量数据可以真实反映IP网络的性能;另一方面,IP FPM可以在线监控IP网络承载的业务的变化,真实准确地反映出业务的运行情况,对于网络的故障诊断、业务统计有重大意义。

受益
运营商可以通过网管系统监控网络的运行状况,确认网络质量是否符合与用户签订的服务水平协议SLA(Service Level Agreement)。
运营商可以根据统计结果对用户业务进行及时的调整,保证语音、数据业务的正常传输,提升用户的使用体验。

IP FPM基本概念IP FPM统计模型
IP FPM的统计模型是一个通用的对用户业务流进行直接的丢包、时延统计的模型。从统计的角度看,业务流是统计的目标对象,统计的目的就是要得到业务流经过传输网络时所产生的丢包和时延,也就是在该传输网络的入口和出口分别统计,然后汇总得出要统计的性能指标。
图3-1所示,IP FPM的统计过程主要涉及三个对象:目标流、目标流穿越的网络(Transit Network)、统计系统。统计系统进一步按角色进行划分,可以区分为目标逻辑端口TLP(Target Logical Port)、数据收集点DCP(Data Collecting Point)和测量控制点MCP(Measurement Control Point)。
图3-1  IP FPM统计模型


  • 目标流
    目标流是实施IP FPM统计的关键要素,每次统计必须首先指定目标流。
    通过指定IP报文头中的相关字段信息唯一地确定一条目标流,具体包括源IP地址或者源IP地址前缀(即指定源网段)、目的IP地址或者目的IP地址前缀(即指定目的网段)、协议类型、协议源端口号、协议目的端口号、服务类型ToS(Type of Service)。当上述字段全部指定时,可以精细地确定一条流,如果仅指定其中的部分字段,只能粗略地确定一条流。为了保证统计结果的精确性,建议用户将目标流的粒度配置得越精细越好。
  • 目标流穿越的网络
    目标流穿越的网络是承载目标流的网络,即目标流既不在该网络内产生,也不在该网络内终结。该网络可以是二层网络或者三层网络,也可以是L2+L3混合网络,唯一的要求就是该网络内每个节点具有IP可达性。
  • TLP
    TLP是分布在网络边缘的观测点,对应网络中边缘节点的接口,负责完成如下动作:
    • 执行统计动作(丢包统计、时延统计)。
    • 产生统计数据(收发报文计数、收发流量统计、时间戳信息等)。

    对于一条具体的目标流,如果一个TLP是其上游统计点,那么该TLP被称为In-Point-TLP;如果该TLP是目标流的下游统计点,那么该TLP被称为Out-Point-TLP。
  • DCP
    DCP是IP FPM统计系统的数据收集点,对应网络中的边缘节点,负责完成如下动作:
    • 管理和控制TLP。
    • 收集TLP产生的统计数据。
    • 上报统计数据给MCP。

  • MCP
    MCP是IP FPM统计系统的控制角色,对应网络中的中间节点,负责完成如下动作:
    • 收集DCP上送的统计数据。
    • 完成统计数据的汇总和计算。
    • 向用户终端或者网管系统上报统计结果。



染色位
染色位又叫特征标识位。在IP FPM的应用中,染色位可以分为丢包染色位和时延染色位,用来标识某个业务报文是用于丢包统计还是用于时延统计。
在部署IP FPM进行丢包和时延统计时,用户可以选择IPv4报文头中固定的几个比特位作为染色位,选择的依据如下:图3-2  IPv4报文头结构


  • 服务类型ToS(Type of Service)字段的第3位至第7位比特位在实际的应用中使用较少。在确认上述比特位没有被占用的情况下,可以借用这些比特位作为染色位唯一地标识某一特征的业务报文。
  • Flags字段的第0比特位是至今仍然保留的唯一一个比特位,可以直接用来作为染色位唯一地标识某一特征的业务报文。


在部署IP FPM进行丢包和时延统计之前,如果网络中有两个或者两个以上的比特位尚未被规划用作其他用途时,丢包和时延统计可以同时进行。如果网络中只有一个比特位尚未被规划,则丢包和时延统计需要分开进行。






IP FPM基本原理功能简介
IP FPM是一种对多点间业务流进行直接统计,得到网络的丢包统计、业务路径时延等性能指标的统计方法。
表3-1描述了IP FPM的分类,以及它们各自的使用场景和选取原则。表3-1  IP FPM性能统计分类
类别
场景

连续端到端性能统计
为了防止网络性能劣化而用户不能感知的情况发生,用户可以部署端到端连续性能统计功能,持续监控网络的运行情况。

按需端到端性能统计
当用户发现网络性能劣化,或者用户希望根据需要选取指定的业务流发起实时性能统计时,可以通过端到端按需性能统计功能查看近期详细的性能统计信息。


设备实现的IP FPM特性支持如下功能:
  • 丢包统计
    • 点到点丢包统计是指通过测量指定两台设备之间链路的丢包情况,确定链路的质量。
    • 多点到多点丢包统计是指通过测量指定的多台设备之间链路的丢包情况,确定链路的质量。


  • 时延统计
    • 点到点双向时延统计是指通过测量指定的两台设备之间链路的往返时延,确定链路的质量。





实现过程
一个承载网络存在着网络边界,对于穿越该承载网络的流量,一定是从某些边界进入网络,从某些边界离开该网络。如图3-3所示,网络设备Router的Ingress方向接口,从该接口进入网络的报文数记为PI;并从某些边界离开该网络,网络设备Router的Egress方向接口,从该接口离开网络的报文数记为PE。
图3-3  IP FPM统计原理图


在某一个统计周期内,所有进入网络的流量与离开网络的流量之间的差,即为承载网络在该统计周期内的丢包数。
  • 所有进入网络的流量,即Ingress方向的报文数之和:PI=PI1+PI2+PI3
  • 所有离开网络的流量,即Egress方向的报文数之和:PE=PE1+PE2+PE3

在某一个统计周期内,指定的两个网络节点间,同一条业务流进入网络的时间,与离开网络的时间之间的差,即为网络在该统计周期内的时延。

丢包统计
丢包统计功能是指在某一个测量周期内,统计所有进入网络的穿越流量与离开网络的流量之间的差。
图3-4是典型的端到端性能统计网络,业务报文从RouterA进入网络,从RouterB离开网络。图3-4  丢包统计原理图


  • t0时刻:RouterA对第一个周期的入口业务报文的丢包染色位置1,并启动计数器对丢包染色位为1的业务报文进行计数。
  • t1时刻:经过网络转发和网络时延,RouterB开始接收第一个周期的丢包染色位为1的业务报文,并启动计数器对丢包染色位为1的业务报文进行计数。
  • t2时刻:RouterA对第一个周期的入口丢包染色位为1的业务报文计数结束,得到本周期内丢包染色位为1的业务报文的计数值PI1,并开始对下一个周期的入口业务报文的丢包染色位置0及启动计数器对丢包染色位为0的业务报文进行计数。
  • t3时刻:RouterB收到第一个周期内的全部丢包染色位为1的业务报文,得到本周期内丢包染色位为1的业务报文的计数值PE2。RouterB从t1时刻开始接收丢包染色位为1的业务报文,设备内部的定时器在经过一个周期的时长之后(即t3时刻),判断本周期接收丢包染色位为1的业务报文结束,而不是根据是否收到丢包染色位非1的业务报文来做判断。该机制可以有效避免报文乱序影响设备对业务报文的统计,确保每个周期内的统计得到的业务报文计数的准确性。

  • t4时刻:RouterA对第三个周期的入口业务报文的丢包染色位置1,并启动计数器对丢包染色位为1的业务报文进行计数。
  • t5时刻:经过网络转发和网络时延,RouterB开始接收第三个周期的丢包染色位为1的业务报文,并启动计数器对丢包染色位为1的业务报文进行计数。
对于RouterB,只要在t3时刻之后、t5时刻之前读取PE2,就能够得到第一个周期内丢包染色位为1的业务报文的接收计数。从而可以得到第一个周期内丢包染色位为1的业务报文统计计数:LostPacket=PI1-PE2

时延统计
时延统计功能是指在某一个测量周期内,统计指定业务流进入网络的时间与离开网络的时间之间的差。
IP FPM支持的时延统计功能是指设备对业务报文进行抽样,记录业务报文在网络中的实际转发时间,从而计算得出指定的业务流在网络中的传输时延。图3-5  时延统计原理图



结合图3-5,介绍时延统计的实现原理。
  • RouterA->RouterB方向:
    • t1时刻:RouterA对某一指定的入口业务报文的时延染色位置1,并获取时间戳t1。
    • t2时刻:经过网络转发和网络时延,RouterB的出口开始接收到时延染色位为1的业务报文,并获取时间戳t2。

  • RouterB->RouterA方向:
    • t3时刻:RouterB对某一指定的入口业务报文的时延染色位置1,并获取时间戳t3。
    • t4时刻:经过网络转发和网络时延,RouterA的出口开始接收到时延染色位为1的业务报文,并获取时间戳t4。



双向时延为:2d=(t2-t1)+(t4-t3)=(t4-t1)-(t3-t2)。


游客,如果您要查看本帖隐藏内容请回复








发表于 2021-7-21 10:44:55 | 显示全部楼层
谢谢,学习学习
沙发 2021-7-21 10:44:55 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2021-7-21 12:13:46 | 显示全部楼层
多谢分享 多谢分享 多谢分享
板凳 2021-7-21 12:13:46 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2022-6-10 16:29:56 | 显示全部楼层
谢谢楼主分享609716
6# 2022-6-10 16:29:56 回复 收起回复
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2025-5-21 22:17 , Processed in 0.095970 second(s), 26 queries , Redis On.  

  Powered by Discuz!

  © 2001-2025 HH010.COM

快速回复 返回顶部 返回列表