双链路备份原理描述
在AC+FIT AP的网络架构中,AC集中管理和控制无线用户的WLAN业务,一个AC往往控制几百个AP和上万个STA。当AC故障或AC和AP间的CAPWAP链路出现故障时,导致AC关联的用户业务中断,因此,AC的可靠性显得尤为重要。
如图9-1所示,在WLAN网络中部署两台AC,一台为主AC,一台为备AC,AP分别与主备AC建立CAPWAP隧道,AP与主备AC之间定期交互CAPWAP报文来检测链路状态。正常情况下,主AC控制STA的无线接入功能,当AP检测到AP与主AC之间的链路发生故障时,AP通知备AC启动主备倒换,备AC升为主AC控制STA的无线接入功能,提高WLAN网络可靠性。当原来的主AC故障恢复后,AP通知主备AC进行主备回切,故障的AC重新变为主AC控制STA的无线接入。
图9-1 双链路备份组网图

主备CAPWAP链路的建立过程
主备倒换AP建立双链路后,会定期向主备AC进行Echo探测,并在Echo报文中携带链路的主备信息。当AP检测到主链路中断后,则AP在发送给备AC的Echo Request报文中携带主信息,备AC收到Echo Request报文后判断该链路已经变为主状态,将自己从备AC切换为主AC,同时AP把STA的数据业务向新的主AC上发送。
主备回切AP会定期发送Discovery Request报文检测原来的主链路的状态,当链路恢复后,AP检测到该链路的优先级比当前使用的主链路的优先级更高,触发回切。为避免网络震荡导致频繁倒换,等待20个Echo周期时间后,通知AC进行主备回切,同时AP把STA的数据业务向新升级为主的AC上发送。
N+1备份原理描述介绍N+1备份组网中主备AC的主备选择,主备倒换和主备回切的过程。
N+1备份组网中存在多个AC,AP需要对发现的多个AC进行主备选择,选择其中优先级最高的AC作为主AC,与其建立CAPWAP链路后接入。当主AC或主AC和AP间链路故障时进行主备倒换,提高WLAN网络可靠性。当原来的主AC或链路故障恢复后,进行主备回切,以便备AC释放资源为其它主AC继续提供备份服务。

N+1备份组网中的各个AC产品形态可以不同,只需要保证AC的软件版本一致,因此同一个备AC可以为不同形态的多个主AC提供备份服务。
主备选择N+1备份组网中,AP与AC建立CAPWAP链路的过程和普通的CAPWAP链路建立过程类似,具体请参见AP上线过程中的“CAPWAP隧道建立阶段”。区别在于在Discovery阶段,AP发现AC后,还要选择出最高优先级的AC作为主AC接入。
在Discovery阶段,AP发送Discovery Request报文,AC在收到AP的报文后会回应Discovery Response报文,并在Discovery Response报文中携带N+1备份开关、AC优先级、负载情况以及AC的IP地址。AP根据收到的多个AC回应的信息,来选择主AC并开始与其建立CAPWAP链路,优选顺序如下:- 比较AC的优先级,优先级最高的作为主AC。优先级取值越小,优先级越高。优先级的具体判断方式参考主备优先级;
- 优先级相同情况下,比较AC设备的负载情况,即AP个数和STA个数,负载轻的为主AC。优先选择当前可接入AP数大的AC为主AC,如果当前可接入AP数相同,则选择当前可接入STA数大的AC为主AC;

当前可接入AP数=可接入的最大AP数-当前已接入的AP数
当前可接入STA数=可接入的最大STA数-当前已接入的STA数
- 负载相同情况下,继续比较IP地址,IP地址小的为主AC。
在规划N+1备份组网时,需要保证通过比较AC的优先级就能选择出主AC,以确保所有AP都能够在预先规划的主AC中上线。否则AP上线时会根据AC的负载或IP地址情况选择主AC,无法确保AP在预先规划的主AC中上线。
主备优先级
AC上存在两种优先级:- 全局优先级:针对所有AP配置的AC优先级。
- 个性优先级:针对指定的单个AP或指定AP组中的AP配置的AC优先级。
当AC收到AP发送的Discovery Request报文时,如果AC没有为该AP配置个性优先级,则在回应的Discovery Response报文中携带全局优先级;如果AC已为该AP配置了个性优先级,则在回应的Discovery Response报文中携带个性优先级。正确配置主AC和备AC的不同优先级,可以控制AP能够在指定的主AC或备AC上线。
以具体图例介绍选择主AC的过程。如图9-2所示,假设AP能够发现所有AC:图9-2 选择主AC

- 在Discovery阶段,AP_1通过向AC发送Discovery Request报文,请求AC的回应。
- AC回应Discovery Response报文,其中携带AC的优先级信息。AC先判断是否为指定AP配置了个性优先级,如果是,则返回AP个性优先级,否则返回全局优先级。如图9-2所示,当AC_1接收到AP_1的Discovery Response报文时,由于AC_1仅指定了AP_1的个性优先级,则返回给AP_1的优先级为3。AC_2和AC_3没有为AP_1配置个性优先级,所以AC_2回应全局优先级6,AC_3回应全局优先级5。
- AP_1根据所有AC回应的信息,进行优先级比较,比较出AC_1的优先级最高,选择AC_1作为主AC,发送关联请求接入。
如果AC_1或AC_1和AP_1间的CAPWAP链路发生故障,在主AC上没有指定备AC的前提条件下,AP_1会重新发送Discovery Request报文,获取AC的优先级。此时AC_2回应全局优先级6,AC_3回应全局优先级5,比较出AC_3优先级最高,所以选择AC_3作为备AC发送关联请求接入。
主备倒换正常情况下,AP只和主AC建立CAPWAP链路,并定期向主AC发送心跳报文进行心跳检测,不和备AC建立CAPWAP链路。当AP检测到心跳报文超时后,认为AP和主AC间的链路中断,会与备AC建立CAPWAP链路。建立链路存在两种情况:- 如果主AC上配置了备AC的IP地址,则AP直接和备AC建立CAPWAP链路。
- 如果主AC上未配置备AC的IP地址,则AP需要通过发送广播Discovery Request报文发现AC,重新进行主备选择、选出备AC,再和备AC建立CAPWAP链路。
建立CAPWAP链路后备AC会重新下发配置给AP,为保证备AC下发给AP的WLAN业务配置和主AC下发的相同,必须要求所有主AC上的WLAN相关业务配置,都要在备AC上同样配置。AP选择备AC建立CAPWAP链路,在备AC中上线并由备AC下发配置的过程称为主备倒换。
为保证AP能够在主备倒换后正常工作,需要同时满足下面两个要求:备AC中能够上线的AP数不小于任意一个主AC中实际上线AP数。
假设备AC中能够上线的AP数为500,则每个主AC最多只能有500个AP上线,如果某个主AC中上线600个,此主AC故障后,由于备AC上最多只支持500个AP上线,剩余的100个AP将下线,无法继续为STA提供业务。
所有主AC中上线的AP数总和不能超过备AC中可配置AP规格数目。
可配置AP规格数目是指在AC上能够添加的AP的最大数目。假设备AC中可配置AP规格数目为1000,主AC_1中有300个AP上线,主AC_2中有400个AP上线,如果继续增加主AC,则新增的主AC中上线的AP最多不能超过300个。原因在于所有主AC中上线的每个AP都要在备AC中添加并配置相应的业务。这样任意一个主AC发生故障,主备倒换后,备AC都能够为AP提供和原来相同的业务。
多个主AC同时发生故障、进行主备倒换后,不能保证它们管理的所有AP都能够在备AC中上线。如图9-3所示,假设AP_1到AP_300共300个AP在AC_1中上线,AP_301到AP_700共400个AP在AC_2中上线,AC_3作为备AC且最多允许500个AP上线。图9-3 主备倒换

- 如果AC_1故障,AP_1到AP_300共300个AP都会进行主备倒换在AC_3中上线;当AC_1故障恢复后,AP_1到AP_300进行主备回切重新在AC_1中上线。
- 如果AC_1故障恢复后,AC_2发生故障,则AP_301到AP_700共400个AP都会进行主备倒换在AC_3中上线;当AC_2故障恢复后,AP_301到AP_700进行主备回切重新在AC_2中上线。
- 如果AC_1和AC_2同时发生故障,此时仅最先与AC_3关联成功的500个AP能够进行主备倒换在AC_3中上线,剩余的200个AP无法在AC_3中继续上线,这些AP的业务将中断。

主备回切AP和备AC建立CAPWAP链路后,从备AC获取对应主AC的IP地址,然后定期发送Primary Discovery Request报文对主AC进行探测。主AC恢复后,会回应AP的探测报文,并携带优先级。AP通过AC回应的报文判断主AC恢复,且主AC的优先级高于当前连接AC的优先级,如果回切开关已使能,此时会触发回切。为避免网络震荡导致频繁倒换,通常会在等待20个心跳周期时间后,通知AC进行主备回切。如图9-4所示,AP会和当前AC断开CAPWAP链路,继而和主AC重新建立CAPWAP链路,同时AP把STA的数据业务向原主AC上发送,以便备AC释放资源为其它主AC继续提供备份服务。AP重新与主AC建立CAPWAP链路,在主AC中上线并由主AC下发配置的过程称为主备回切。
图9-4 主备回切
