设为首页收藏本站language 语言切换
查看: 3651|回复: 1
收起左侧

思科IOS IP SLA详解--Part 1--概论及原理

[复制链接]
发表于 2011-10-21 11:48:49 | 显示全部楼层 |阅读模式
思科 IOS SLA (以下简称IP SLA) 基于思科SAA技术发展而来,并在其基础上进行了增强,该特性让用户可以监测路两台思科路由器之间或思科路由器与一个远程的IP设备之间的网络性能。本文集中讨论了新的SLA(又称作SAA)信息,包括使用与配置原则,如何从IP SLA中抽取数据,如何使用命令行(CLI)和SNMP来配置IP SLA等内容。SNMP的MIB细节可以参考Cisco-RTTMON-MIB 。

1 IP SLA概述

1.1 IP SLA用途
IP SLA可以用于以下用途

  • SLA监测
  • 网络性能监测
  • 网络服务评估
  • 端到端的可用性监测
  • 网络故障诊断
  • MPLS网络监测
  • VOIP网络监测


1.2 IP SLA 优点

  • 增强布署新应用的信心
  • 监测与确认服务质量,实现差别服务
  • 增加用户信心与用户满意度
  • 通过SLA的度量,用户可以确认他的网络应用照他们需要的那样运行
  • 网络有问题时可以预告提醒用户
  • 可以连续的、可靠的周期性度量网络的性能


1.3 IP SLA 特性概述

测量能力:可以测量UDP响应时间、单向延时、抖动、掉包情况和连通性;ICMP响应时间与连通性、每一跳的ICMP 响应时间与抖动;DNS查询、TCP 连接、HTTP 处理时间等的性能度量;丢包统计;DHCP响应时间测试;从网络设备到服务器的响应时间;模拟Voip的codec’s测试出语音质量的MOS/ICPIF得分;DLSw+通道性能;
IP SLA可以通过命令行或SNMP(Cisco-RTTMON-MIB)来实现前期告警,可以定义SLA的监测阈值,当一个SLA达到阈值时能产生一个SNMP TRAP,并且能触发相关的作业以实现更详细的分析;IP SLA可以实现灵活的调度,可以在任何给定的时间或以任意的时间间隔周期性运行。

图1 Cisco IOS IP SLA


                               
登录/注册后可看大图
昨天 19:06 上传
下载附件 (53.39 KB)




1.4 使用 IP SLA来度量网络

IP SLA是一个网络性能度量与诊断工具,它通过主动在多个站点之间或多条路径之间发送数量来实现对网络性能的度量。IP SLA使用时标来计算如抖动、延时、响应时间这、丢包率、语音MOS值等网络性能参数。用户通过命令行或RTTMON MIB可以定义一个IP SLA动作(探针),定义IP SLA 动作时可以明确这个动作所产生的流量的包尺寸、发包间隔、协议类型、DSCP 标记以及其它一些参数;然后让这个动作在适当的时候运行并返回度量性能所需要的参数。例如,我们可以定义一个用来度量UDP的抖动的动作,这个动作每分钟每隔20ms 发出10个64Bytes的包。

由 IP SLA探针所返回的数据存储在RTTMON MIB中,可以通过命令行或网络管理应用来提取其中的网络性能统计数据。可以让IP SLA探针在任意时间点或以任意的时间间隔连运行,通过设置不同的DSCP值,IP SLA可以测试同一链路上不同类型的流量的性能。

运行Cisco IOS的目标路由器可以需要配置成IP SLA Responder(响应器),用于处理测试包并提供更详细的时标信息。响应器可以将目标路由器的处理延时等信息发送回源路由器,这样在后期计算时这个处理延时就可以去掉以提高测试的精确性。使用IP SLA时单向测量机制也是可行的。

IP SLA利用SNMP trap提供了预告警告机制,每个测试探针可以预告配置一个性能阈值;当结果超出阈值时,IP SLA将产生一个SNMP TRAP 并发送到网管应用上,可用的SNMP Trap包括:循环时间、平均抖动、单向延时、抖动、丢包率、MOS值、连通性测试等,同时管理员也可以定义IP SLA去执行一个新的探针,例如当延时超出阈值时可以触发第二个作业――测试每一跳的延时来将问题区域隔离出来。

2 SLA 监测介绍

2.1 概述

企业IT 部门向内部客户或其它部门提供SLA 的压力在不断的增长,如何去度量外部提供的SLA 也是一个大问题;服务供应商为了提高客户满意度也有提供SLA 的动机;管理上需要确保网络能满足生产经营活动的需要;终端用户需要保证在他需要时,关键应用与服务总是可用的;一个组织在布署一个新的技术、新的关键应用或IP服务(如voip),通常需要一个SLA或服务水平的验证。交付SLA的复杂度日益增加,很难决定要去监测些什么,怎么去度量,以什么样的频率去搜集数据。在一个复杂的多服务网络中,要实现端到端的服务监测也是相当困难的。服务水平管理,包括SLA,是解决这个问题的一个关键组件,并且可以增加网络可用性。

2.2 定义SLA 需求

在定义SLAs 时,最为关键的是客户所关注的事务处理目标,只有在明确客户关注什么的情况下,才能制定出切实可行的服务水平参数来。太多的、太复杂的不可行的参数往往会达不到管理服务水平的目标,并受到客户的责备。一份SLA越通用,SLA的需求也就越简单,服务供应商的SLA必须同时考虑连接性与主机应用:

  • SLA的度量是需要的
  • 能够以合适的粒度去界定SLA问题
  • 出现 SLA违背时能施以财务惩罚
  • 可通过WEB访问的商务报告和技术细节报告。
  • 在布署新的应用时确定关键的业务目标已达到


2.3 服务水平合同与SLAs

SLA 是服务水平合同(SLC)中的关键组成部分,SLC 定义了服务提供者向终端用户提供的连接性与性能协议,服务提供者可以在企业内部(如企业内的IT 部门就是其它部门的服务提供者),也可以是一家外部公司(如提供广域连接、主机服务的的ISP)。一个SLC通常包括多个SLA,所以一个特定的SLA 的违反会引起整个SLC 的违反。服务水平管理解决方案需要提供一个能管理一个SLC内所有SLA的解决办法。应当能独立的监测多个SLC及其相关的SLA,这通常包括了预期的服务水平和最小服务水平两个参数,例如,一个为分支机构和总部提供连接的SLC定义了一条64kbps 的链路,要求在一个月的计算期内,链路的平均延时在100ms 以面,这个平均延时就是预期的服务水平,这时的最小服务水平可以是一天的计算期内,平均延时在300ms以内。端到端的SLC常用于性能监测也失效管理,IP SLA提供了每一个SLA的细节信息。

3 使用 IP SLA监测网络

用户必须决定何时去监测服务水平的参数值,这个过程中的一个重要影响因素是所考虑的SLA的类型,在决定何时监测服务水平之间需要解决以下几个问题。
首先,用户必须知道服务水平合同什么时候真正开始生效?度量的主要目标是什么?什么参数是需要监测的重要参数?第二步要做的就是对网络中的流量模式进行评估,度量采样做得越多,所取得的流量模式就越准确。更多的点意味着信息更精确,相反,更多的度量采样潜在的引起管理流量的上午,让可用带宽变小。活动的度量将模拟网络中的流量型号,例如正确的包尺寸,间隔等。

3.1 例 1:测量从分支机构到中心办公室的数据流量性能

图2 例1 的网络拓朴


                               
登录/注册后可看大图
昨天 19:09 上传
下载附件 (20.95 KB)




一个企业客户有一个总部,和两个分支机构办公室;其中一个分支机构使用单独的帧中继电路(256Kbps),另一个通过Internet VPN 的方式访问中心办公室。两个分支办公室的用户都需要访问位于总部的web服务。例如,公司要求提供99.95%的可用性,响应时间要求小于50ms,对于通过Internet VPN 访问总部的分支机构,提供了一个延时低于100ms 的SLA。基于这些数据,该企业必须考虑如何度量与验证两个分支办公室都能取开满意的服务水平,如果不能达到这个服务水平,就需要确认是网络中哪个/哪些部件(如广域链路、客户端应用、Web 服务器)导致了问题的产生。

3.1.1 选择适当的作业

在SLA布署中的第一步就是分析需要监测哪些参数,在前面介绍过IP SLA所能提供的作业类型,下面对这些作业再作详细的说明:

3.1.1.1 UDP Echo 作业

UDP ECHO 作业可以测试从路由器到IP设备之间的端到端的响应时间或连通性,UDP是一个可以报告错误并提供与IP包处理相关的其它信息的网络层(第三层)协议,响应时间是通过计算发出UDP ECHO 消息和收到UDP echo响应之间的时间差来实现的。在目标路由器上启用IP SLA Responder 可以提高UDP echo的精度。在本文后面将详细讨论IP SLA Responder。

3.1.1.2 DNS

DNS响应时间是通过计算发出DNS请求和接收到响应之间的时间差来实现的,这个作业可通过用户提供的主机名查询IP,也可通过用户提供的IP地址查询相应的主机名。

3.1.1.3 DHCP,动态主机配置协议

动态主机配置协议(DHCP)响应时间是计算从发出请求到收到响应之间的差值实现的,当取得IP 地址后,源路由器会将这个IP 释放回地址池,从而避免出现消耗大量IP 地址的情况出现。

3.1.1.4 HTTP

HTTP作业可以度量连接或从HTTP服务器访问数据的往返时间(RTT),台要通过一个URL来定义,HTTP服务器响应时间度量由以下三部分组成:

  • DNS查询—域名查询的往返时间RTT taken to perform domain name lookup
  • TCP连接—TCP连接处理的往返时间
  • HTTP处理时间发出请求到从服务器收到响应的往返时间


3.1.2 选择适当的测试组合

在定义一个SLA 的过程中,最困难的就是选择适当的测试组合,在做这一步之前,必须先满足以下条件:

  • 源设备必须是思科设备,并且能运行IP SLA――IOS 版本为12.0(5)T或更新;
  • 当做IP SLA 作业时,目的设备可以是一个IP 设备,使用思科路由器中的IP SLAResponder 可以提高测量精度


当这些条件满足时,就可以集中精力选择设备组合了。一般情况下,源设备是边缘的路由器或企业网络与供应商网络的边缘路由器。

表 1:本例中所选择的测试组合:

目的作业说明
CDUDP
ABUDP
BWeb服务器HTTP
DWeb服务器HTTP
AWeb服务器HTTP可选
CWeb服务器HTTP可选


以上就提供了广域连接相关的细节,如DNS查询时间、TCP连接及最终的HTTP作业等。

3.1.3 选择适当的荷载

荷载是包所承载内容的实际尺寸,这个值与包本身的大小不一样;根据协议类型的不同,包头的长度也不同。在选择荷载值时,必须考虑控制包分片的最大传输单元( MTU)的影响,通过控制与MTU相关的荷载尺寸,就可以控制每个采样所发出的包的个数。这个值最好能和网络中实际包的值相一致。

Internet中平均包大小为260Bytes,这个客户也使用这个包尺寸。

3.1.4 选择适当的TOS 位

本用户未实施QOS,在这个例子中不涉及到TOS位

3.1.5 选择适当的采样间隔

IP SLA 发送监控流量采样的频率取决于需要和监控流量本身对网络带宽的需求。采样发生的频率可以基于取得最精确的网络服务水平结论这样一个前提来考虑,但很不幸,一般这是不现实的,在一个昂贵的广域链路上,用户不会允许测试的流量占用太多带宽的。在使用低端路由器时或有大量流量通过路由器时,还得考虑产生SLA 流量对设备本身性能的影响。在这种情况下,需要降低采样的频率或使用一个单独的路由器来做IP SLA作业。更细节的性能讨论,请参见本文的后续章节。
在这个例子中,我们选择了如下的采样间隔:

UDP: 60秒
HTTP: 300 秒

3.1.6 选择适当的域值

一般情况下,服务提供商在SLC中都会提供一个预先定义好的性能域值,ISP提供的SLA中可能包括总延时和可用性的百分比等参数。在这种情况下,选择什么域值是很清楚的。如果这些值都不明确,则需要网络管理员来决定应当选择什么样的域值。目前域值可以有响应时间和抖动计算,不适用于丢包率。

现实的域值案例:

单向延时:
–西欧-美国西部: 90 ms
–美国西部-美国东部: 30 ms
–欧洲: 40 ms
–西欧-非洲: 150 ms
–西欧-北亚: 100 ms
这些数据仅考虑了运营商的骨干链路部分,接入层网络增加的延时还必须增加进来

表2:本例中配置了如下阈值

目的度量域值
AB往返延时< 150 ms>150 ms 或<100 ms
CD往返延时< 200 ms>200 ms 或<150 ms
A,B,C,DDNSDNS 超时10 sec>5 s或<3 s
A,B,C,DWEB服务器TCP 连接< 500 ms>500 ms 或<200 ms
A,B,C,DWEB服务器HTTP超时或5 sec>2 s或<1 s


3.2 例 2:总部到分支机构的电话会议

图3:例2 网络拓朴图


                               
登录/注册后可看大图
昨天 19:18 上传
下载附件 (28.17 KB)




3.2.1 选择适当的作业

在例2 中,业务经理需要在总部和分支机构之间召开电话会议,客户已经通过三个不同的类在链路上布署了QOS。在这种情况下,音频和视频在网络中极度依赖于包的延时和丢包率。
为VOIP 选择一个抖动作业,再为业务数据流量选择一个UDP 作业。未对尽力投递类数据定义作业。

3.2.2 抖动/VOIP

VOIP作业,通过称为抖动,度量了两个方向上面包与包之间延时的变化(源到目的/目的到源),IP SLA 以一个特定的间隔发出一系列的包,包的序号与时标及响应这些包的相关参数被搜集起来计算中间延时的变化。该测量方式在验证VOIP服务中相当有用,使用抖动作业时需要在目标设备上启用IP SLA Responder。
抖动作业与其它作业相比,提供了如下的些信息:

  • 抖动:源-目的,目的-源
  • 丢包情况:源-目的,目的-源
  • 往返时间
  • 如果SLA与Responder 的时钟是同步的,可以测试出单向延时
  • 最精确的作业
  • 包有序列号
  • 12.3(4)T开始提供MOS度量与Codec模拟
  • 12.3(7)T开始提供单向延时、抖动、丢包及MOS的Trap


3.2.3 选择适当的测试组合

  • 相关路由器:W, X, Y
  • 分支路由器: Z
  • 作业:X 到Z; Y 到Z; W到Z


3.2.4 选择适当的荷载大小

使用 200Bytes的包尺寸

3.2.5 选择适当的TOS 字段

从某种意义上来说,不同类型的流量在通过网络时具有不同的优先级。如某公司坚信Email比WEB 流量更为重要,它就可能为Email 流量设置一个比Web 流量更没的优先级。IP SLA可以在IP头中配置TOS位。如果在QOS策略中是使用的DSCP位,DSCP位需要转化为TOS位输入到IP SLA选项中去,因为目前的IP SLA特性不直接支持DSCP值。

表三:定义三个不同的QOS类

IP优先级DSCPToS
VoIP10140160
业务数据10032128
尽力传输00000000


表四:定义5 个不同的QOS类

IP优先级DSCPToS
VoIP10140160
视频10032128
语音控制流量01124096
业务数据00108032
尽力传输00000000


3.2.6 选择适当的采样间隔

抖动使用10个间隔20ms 的64bytes包作为一组,频率如下:
X-Z: 60 sec
Y-Z: 60 sec
W-Z: 180 sec

3.2.7 选择适当的阈值

在这个SLA 中没有特定的阈值,管理员必须进行独立的测试,这里选择了如下表所示的阈值。

表五:本例中所用到的域值

目的度量阀值
X-实时应用Z双向延时< 100 ms,抖动 < 20ms>100 ms 或<50 ms,抖动>20ms
X-关键应用Z双向延时< 500 ms> 500 ms 或<300 ms, 超时5 sec
W-实时应用Z双向延时< 100 ms,抖动 < 20ms>100 ms 或<50 ms,抖动>20ms
W-关键应用Z双向延时< 500 ms> 500 ms 或<300 ms, 超时5 sec
Y-实时应用Z双向延时< 100 ms,抖动 < 20ms>100 ms 或<50 ms,抖动>20ms
Y-关键应用Z双向延时< 500 ms> 500 ms 或<300 ms, 超时5 sec


G.114 标准建议单向延时(电话到电话)低于150ms 是可接受的,我们建议延时不要过超过20-40ms


来自于http://www.netconfed.com/forum.php
发表于 2012-4-29 09:36:07 | 显示全部楼层
沙发 2012-4-29 09:36:07 回复 收起回复
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2025-2-2 12:38 , Processed in 0.057181 second(s), 11 queries , Redis On.  

  Powered by Discuz!

  © 2001-2025 HH010.COM

快速回复 返回顶部 返回列表