容灾的必要性
WCDMA相对于GSM网络,无线侧用户在接入速率上有了很大提高,这对核心网网元的处理能力提出了高要求,单个MSC、MSC Server、MGW所承担的用户话务和信令负荷大大提升。
同时,随着技术的进步以及竞争的加剧,各厂商推出的设备容量也不断提高。在2G网络中,MSC的容量通常为20~30万,HLR的容量通常为50~70万。而在3G网络中,R99阶段的MSC最大容量达100~180万左右;R4阶段的MSC Server、MGW的最大容量达100~180万左右,HLR最大容量达200万左右;R5版本的商用设备虽然还没有大规模推出,不过可以肯定容量将朝着更高的方向发展。
在核心网结构上,R4阶段引入了控制和承载分离的软交换架构,将传统2G网络中的MSC分离成MSC Server和MGW,其中MSC Server负责信令处理、路由和业务;MGW负责媒体流处理。由于MSC Server和MGW之间只是IP上承载的信令,占用的带宽非常少,因此,两者之间可以经济地拉远放置。MSC Server可集中设置在中心城市;MGW由于容量及处理能力的大幅提高,按照集中化原则,也可集中设置。这样,整个R4核心网的建设思路是“大容量,少局所”。一个MSC Server控制多个MGW,组成一个“大本地网”。
R5尽管目前还没有商用组网的实际例子,但它继承了R4的软交换架构思想,因此,仍会采用“大容量,少局所”的大本地网结构。
但是,在R4、R5之前的R99阶段,由于MSC之间的传输仍是TDM话路,因此,集中设置MSC将造成传输的长途迂回,增加运营成本。因此,R99的组网与现在的GSM相比不会有太大的变化,只是把原来的MSC进行软硬件升级,以支持WCDMA的接入。
从以上分析可以看出,基于移动软交换架构的WCDMA核心网,其集中设置的MSC Server将成为网络和设备安全的重要隐患,因此,有必要在建网时考虑其容灾备份方案,预防网元单点故障特别是MSC Server设备故障,而引起大面积网络瘫痪的情况发生。
容灾方案分析
R99核心网容灾方案
R99核心网结构与GSM相比没有变化,因此,其单点故障位置及其对网络造成的影响也与GSM一样:MSC失效,导致MSC覆盖区域的网络不可用;HLR失效导致HLR覆盖区域的网络不可用。因此,R99可以采用GSM组网的安全性措施。对于HLR的容灾方案而言,可以采用N+1备份方案来解决HLR失效的问题。即对主用HLR配置备份HLR,并在两者之间通过数据同步机制实现用户数据的同步,当主用HLR出现故障时,备份HLR接管主用HLR的业务,减少对现网用户的影响。
GSM组网没有针对MSC失效的安全性措施,只是通过MSC设备本身的可靠性措施,即设备的单板备份和端口备份来保证MSC网元的安全。因此,在R99组网中也存在这个安全隐患。通常的解决方法是,尽量采取小容量MSC的策略来规避风险,但这不能从根本上解决问题。
R4核心网容灾方案
R4核心网软交换架构。可以看出,其单点故障在于:(1)MSC Server失效,导致MSC Server覆盖区域的网络不可用。(2)MGW失效,导致MGW覆盖区域的网络不可用。(3)HLR失效,导致HLR覆盖区域的网络不可用。
针对上述故障点,相应的安全容灾方案有:(1)在MSC Server层面,实施双归属方案。建设MSC Server容灾备份中心,一个MGW同时接入两个MSC Server,一个主用,一个备用,当主用MSC Server发生故障后,MGW重新注册到备用MSC Server,继续原来的事务。(2)在MGW层面,实施MGW负荷分担技术。一个RNC同时接入多个MGW,MGW之间负荷分担,当一个MGW发生故障时,其RNC的负荷由其他MGW承担,RNC的业务处理不影响。(3)在HLR层面,采用HLR的N+1备份方案(和GSM的HLR容灾方案相同)。
另外,也可以同时通过板级和端口级的设备冗余备份来实现一定的安全容灾。
R5核心网容灾方案
R5核心网容灾技术基本等同于R4。但R5特有的是,在Iu接口引入了Iu Flex技术。即一个RNC可以同时接入多个MSC Server,MSC Server间负荷分担,多个MSC Server组成一个“Server池”,共同控制几个位置区。当一个MSC Server发生故障时,RNC可以将故障MSC Server的事务转发给其他MSC Server处理。Iu Flex容灾是WCDMA一项研究中的核心网容灾技术。
三大容灾技术
MSC Server双归属容灾
双归属技术来源于固定软交换,是针对NGN网络结构特点而提出的一种网络可靠性解决方案。其接入层的各种网关设备(TMG、AG、SG)同时与核心控制层的两个软交换机Soft Switch A/B相连,即同时受控于两个软交换机。在正常情况下,Soft Switch A处理TMG、AG、SG相关业务,当它出现异常时,改由Soft Switch B控制。
在R4核心网中采用的MSC Server双归属容灾方案的主要方式是,将MGW从逻辑上分成2个虚拟MGW,并同时归属于两个MSC Server控制。预先将MGW和两个MSC Server之间的数据配置好,并让MGW在两个MSC Server上登记,使MGW和两个MSC Server之间建立归属关系。在主用MSC Server发生故障无法继续服务时,MGW向备用MSC Server发起注册请求,系统将话务引导到备用MSC Server,从而增强系统的安全性。
MSC Server的双归属方案可支持1+1主备、1+1互备两种方式。
主备方式在每个大区配置两个MSC Server,其中MSC Server1为主用MSC Server,MSC Server2为备用MSC Server。在正常工作模式下,MSC Server1负责所辖大区所有媒体网关的管理与呼叫处理,MSC Server2通过与MSC Server1间的心跳链路备份线,实时监控MSC Server1的工作状态,一旦MSC Server1出现故障,MSC Server2立即接管该大区的所有MGW的管理及呼叫处理,保证网络的可用性。在这种容灾方式下,大区的MSC Server应该采用大容量的交换局点,只有这样,才在经济上比较可行。
互备方式是将每个大区分为两个子域,称为域1和域2。每个子域配置一台MSC Server,其中,域1的为MSC Server1,域2的为MSC Server2,它们互为备份。在正常情况下,MSC Server1、MSC Server2分别管理各子域的MGW设备及承担本域内的业务处理。当一个设备出现故障时,其所有业务处理和MGW管理任务立即由另一个接管。这种备份方案比较经济,没必要专门为某台MSC Server设置备份点。但是,备份局点在接管故障局点业务后,其本身的业务处理能力将经受考验,通常,它难以满足两个局点业务负荷的需求,因此,要求被接管的MSC Server容量不能过大。
在上面两种方式中,MSC Server之间都要有备份通道,用于对VLR签约数据、移动性管理数据、动态资源数据等进行备份。备份周期可由用户设定。备份通道的传输协议可采用TCP/IP。
MGW负荷分担
在R4系统的Iu接口侧,通常一个RNC连接一个MGW。MGW负荷分担技术主要是通过MGW互备方式来解决MGW的单点故障问题。
形成负荷分担关系的MGW组成MGW资源池(MGW Pool),MGW1、MGW2、MGW3构成了MGW资源池,并由一个MSC Server控制。在理论上,MGW资源池不限制MGW的数目,运营商可根据情况自己确定。
RNC通过MGW1接入到核心网。MGW负荷分担技术在RNC—MGW1连接的基础上,增加了RNC—MGW2、RNC—MGW3两条备份连接线。在正常工作时,RNC—MGW1是激活工作状态,RNC—MGW2、RNC—MGW3处于非工作状态。
MSC Server通过H.248的SCTP(基于IP的信令传输)连接和Iu接口的SCCP(信令连接控制部分)连接判断Iu连接状态,当所有H.248的SCTP连接和SCCP连接都断了,并在一定的时间内不能恢复,即判断出现故障,切换到备份MGW。而RNC则是通过Iu接口的MTP3B(基于ATM的信令传输),判断对端MGW是否故障。当检测到故障后,启动切换流程,切换到备份MGW。
当某一个MGW发生故障时,非故障的MGW将承担两个MGW的话务,这对于其业务提供能力来说,有可能难以满足需求。因此,必须通过流控机制来保障设备免遭阻塞,但这会带来用户呼损率的增大。
Iu Flex容灾
在R5版本以前,没有考虑网络的共享需求,一个RNC只能被一个核心网节点控制。也就是说,RNC通过相连的MGW只能与一个MSC Server保持一一对应关系,如果MSC Server发生故障,即使实施了MSC Server双归属、MGW负荷分担等容灾技术,MSC Server管辖下的RNC也不能正常工作,从而造成服务区内业务的中断。因此,在R5阶段,出现了支持RNC与多个MSC Server相连接的Iu Flex技术,也称为RAN共享方式,对应的3GPP标准协议号为3GPP TS 23.236 v5.4.0。
采用Pool-Area概念,由多个MSC Server组成一个Server池,共同控制一个或多个位置区(LA)。这些LA中的RAN同时接到池中的每个MSC Server。RNC的终端用户按照负载均衡的原则,可以注册到池中的任意一个MSC Server上,MSC Server间进行负荷分担。当一个MSC Server发生故障时,RNC可以将到故障MSC Server的事务转发给其他MSC Server进行处理。这种方式引入了一种新的路由机制,使RNC与多个MSC Server保持路由对应关系。当其中一个MSC Server瘫痪时,通过调整相应的Iu接口参数,将话务转移到新的MSC Server上,实现了WCDMA核心网网元的安全容灾。
容灾方案比较
MGW负荷分担方式是在MGW发生故障时,对RNC进行切换的容载方案。其他两种方案都是针对MSC Server故障的容灾方案。
Iu Flex在R5版本中引入,主要是在Iu口的变化。它要求RNC和终端都要做较大的修改。在Iu Flex方式中,RAN同时接入多个MSC Server,MSC Server之间是负荷分担关系,一个MSC Server的故障不会影响用户的服务。MSC Server之间的切换是不需要时间的。
MSC Server双归属方式源自于固定软交换,有一定的工程实施经验,只需在核心网网络配置上做相应修改即可。MSC Server双归属方式需要用户动态资源数据的同步过程。
对于用户密集的大城市或特大城区,如果存在多个MSC Server,且在设备支持的情况下,建议采用Iu Flex来实现网络安全容灾解决方案。因为它不仅能解决网络安全问题,而且还会引入其他组网优势,如基于用户的负荷分担和管理,可以大大降低接口信令流量。
在“大容量,少局所”的跨地域大本地网组网模式下,由于Iu Flex方案需要RNC将Iu接口同时连接到多个MGW,会引起Iu接口不必要的路由迂回,因此,建议采用MSC Server双归属容灾方案。
总之,WCDMA核心网的容灾是WCDMA系统部署中的技术难题之一,需要随着网络的逐渐部署,不断深入研究与探索。目前,只有少数设备厂商可以提供WCDMA核心网的容灾解决方案。