近年来,光纤通信系统的性能指标得到很大提高,目前使用的密集波分复用(DWDM)系统已经普遍达到16×10 Gb/s或32×10 Gb/s的总容量,而随着喇曼放大器(RA)和光孤子技术等的逐渐成熟,更高传输速率的系统也正在实用化。在OFC2002和2003会议上NEC公司和Alcatel公司分别报道了10.92 Tb/s(273×40 Gb/s)和10.7 Tb/s(256×42.7 Gb/s)的实验系统,而40×40 Gb/s系统的无电中继最长距离已经达到了10 000 km[1],传统的衰减和色散因素对系统性能的影响已经得到了有效抑制。与此同时,基于微机电系统(MEMS)和大规模平面阵列波导(AWG)的光交叉连接(OXC)和光分插复用器(OADM)的相关技术也处于快速发展中[2, 3],而自动交换光网络(ASON)和通用多协议标记交换(GMPLS)在光网络中引入了控制机制。智能化的光网络不仅可以提供大量的传输带宽,而且可以根据用户的需求灵活地建立路由,满足不同运营商之间以及对新业务的良好的互通及兼容性,降低运行、管理和维护成本[4]。 随着光网络的发展,IP over WDM网络已经被公认为下一代网络的核心。随着网络拓扑的日趋复杂和网络运行所处环境的日益复杂,如何保证IP光网络的生存性成为目前研究的一个重点问题[5, 6]。
完整的生存性策略应该包括以下几个部分:即故障的发现、定位、声明和解除,本文重点讨论的是故障的解除,也即恢复机制。从基本原理来说,恢复机制可以分为保护和恢复两种机制[7—9]。保护机制的基本思想是预先规划一部分冗余容量作为备用系统,当传输线路或者节点出现故障时,将受故障影响的主用系统迅速倒换到备用系统上。保护机制的最大优点是可以实现业务的快速切换,对客户信号质量影响较小甚至可以忽略。例如在同步数字体系(SDH)中采用的自愈环(SHR)机制,其保护倒换时间小于50 ms,可以满足绝大部分实时业务的要求,保护机制的主要缺点是要预留相当数量的备用系统(最大可达100%),因此成本较高,而且主要依赖于手工配置。恢复机制是利用路由算法等机制实现端到端的整条或部分路由的重新建立,以绕过故障节点或路由。恢复机制的最大优点是无需事先对每一条工作路由都规划冗余备份,可以动态地应对网络中的故障,效率较高。恢复机制的缺点是恢复时间较长,尤其是当网络规模较大,路由之间节点数量较多时,路由算法的收敛速度难以保证实时业务的连接切断阈值(CDT)要求。保护和恢复机制都可以进一步地分为基于链路和基于通道两类。基于链路的是指当出现网络中出现故障后,仅仅对故障所涉及的部分链路进行恢复;而通道恢复则是从源节点到终端节点端到端的恢复。
以IP over WDM网络为例,IP和WDM层(以下简称光层)都具有各自的保护和恢复机制,因此网络中出现故障后,IP层和光层的恢复机制都会动作。因此究竟是在IP层进行处理,还是在光层处理,还是按照某种规则或顺序进行多层处理是一个很有趣的课题,这也是目前国内外相关研究的重点和难点所在。
1 IP/MPLS恢复机制
多协议标记交换(MPLS)是针对最初的IP网络提出的,IP网络最初提供的基本都是尽力而为型的业务,无法实现端到端的服务质量(QoS)保证,因此在Ipsilon公司的IP Switching、Cisco公司的Tag Switching和IBM的Aggregate Route-based IP Switch ARIS等技术的基础上提出了MPLS技术。MPLS的基本思想可以理解为在无连接的IP网络中引入了虚连接的概念。通过在IP分组头部设置标记,为属于同一个转发等价类(FEC)的分组建立对应的标记交换路径(LSP),网络中的标记交换路由器(LSR)就可简单地根据标记进行转发,避免了费时的最长地址匹配操作。采用MPLS技术不仅可以提高分组的转发速度,而且可以实现诸如流量工程(TE)、虚拟专网(VPN)及不同种类业务的分级QoS等,同时引入MPLS也可以提高和完善IP层的保护和恢复机制。
1.1 MPLS保护机制
MPLS保护机制依赖于对网络资源的预先规划,因此也称为静态的恢复机制。根据所保护的主用系统的不同,可以分为端到端保护、本地保护和环回保护3种[5]。
(1)端到端保护
端到端保护指的是为主用LSP(Working LSP)预先配置一条端到端的备用LSP(Backup LSP)。当网络出现故障时,源节点发出的分组转为在备用LSP上转发,如图1(a)所示,备用LSP在主用LSP正常工作时并不占用资源。
(2)本地保护
本地保护是仅仅在故障节点邻近的部分LSP上进行保护倒换,如图1(b)所示。
(3)环回保护
环回保护也称混合保护,它结合了端到端保护和本地保护的特点,如图1(c)所示。
1.2 MPLS恢复机制
恢复机制相比保护机制而言,可以称为动态的或实时的。当网络中出现故障后,根据某种路由算法快速计算出新的路由,并通过广播或洪泛机制向全网播报新的路由表。恢复机制的性能好坏很大程度上取决于所选取的路由算法,因此,近年来许多新的改进算法得以提出。其中基于约束的快速拓扑约束重路由算法(FTCR)是较好的一个选择[10]。恢复机制的最大好处是无需事先规划和分配网络资源,对网络资源的总体利用率较高。但是相比保护机制而言,恢复机制业务恢复所需的时间较长,同时需要较为复杂的协议体系和控制机制,这一点在网络拓扑结构日益复杂时尤为明显。
2 光层恢复机制
2.1 概述
目前光网络中较为成熟的仍然是光波长交换网络(OWS),而光分组交换(OPS)和光突发交换(OBS)尚处于研究之中,关键问题是目前尚无法实现光域中对光信号的透明时钟提取以及存储、转发等技术。虽然基于光纤的光纤延迟线(FDL)能部分实现光信号的存储,但是与电域中对分组进行存储、缓冲、排队等成熟技术相比,直接对光信号进行处理距离实用还有很大的距离。因此光层恢复机制和IP/MPLS层相比,仅有一些部分相似之处可以借鉴,如光网中也有类似MPLS中的链路和通道级别的保护。考虑到光层的特点,它与IP/MPLS又有着很大的区别。
2.2 光层中的保护机制
光层中的保护机制与IP/MPLS层中的保护机制有相似之处,如也有链路和通道级保护的区别。但是必须注意到,在MPLS保护机制中,备用LSP平时并不占用资源,而在光网络中,当某个波长通道被指配为备用通道时,其他业务即无法对其利用。
保护机制可以分为1+1、M ∶N、1∶N和1∶1等几种形式,其中1∶1和1∶N 都是M ∶N 的特例[11]。1+1保护方式有时也称为并发选收保护方式。源节点将业务同时送入工作信道和保护信道,终端节点前有一选择开关,可以根据信号质量的好坏选择接收。正常工作时从工作信道接收信号,当工作信道出现故障时,保护选择开关切换至备用信道,转由备用信道接收信号。此种保护方式的切换时间很短,几乎不会对业务产生影响,但是缺点是要有100%的冗余。同时在实际的光纤线路中,若不采用异径保护方式即相异路由的话,可能会出现工作信道和备用信道同时被切断的情况(大多数情况下工作光纤和保护光纤都处于一根光缆内或同一条路由)。因此,1+1保护方式一般多应用在业务量较大且较为稳定的节点间使用。
M ∶N 方式是指N 个工作信道共享M个备用信道,备用信道平时并不传送业务,只有当工作信道故障后才会将业务倒换至备用信道,相对于1+1保护方式而言,此种方式对网络资源的利用率较高,图2给出了1+1和1∶1保护的示意图。
2.3 光层中的恢复机制
光层中的恢复机制尚不成熟,目前研究较多的是光路由和波长分配(RWA)。根据是否具有端到端的波长连续性可以将RWA分为端到端的波长通道恢复和虚波长通道恢复两种,两者最主要的区别是在OXC中是否具备光波长转换器(WC)。显然,具有WC的OXC能更好地处理节点处可能出现的波长冲突和拥塞的问题,目前已经有较多的措施可以实现灵活的全光波长变换[12]。 大多数的RWA算法的思路都是在Dijisktra算法上的改进[13],日本电信与日本国立情报研究所(NII)报道了最新的成果是可以依赖GMPLS协议在7 s内实现路由的重新建立,但是这个数字距离电信级的QoS要求而言还存在着相当大的差距。目前ITU-T和IETF都在积极研究ASON和GMPLS的恢复机制。
3 多层恢复机制
在一个多层网络中,当其中的传输线路或者节点(包括光层的OXC/OADM和IP/MPLS层的路由器/LSR)出现故障时,两层各自的保护和恢复机制必然都会有所响应和动作,此时如果没有一个良好的机制加以协调和控制,必然会出现一些问题。
例如,在图3所示的网络中,当某两个OXC间的光纤线路中断时,光层的保护机制首先动作,可以在最短的时间内恢复业务,IP/MPLS层的恢复机制还未触发或尚未完成时故障可能已经被光层的恢复机制恢复。而当OXC节点本身出现问题时,光层本身的恢复机制无法实现故障恢复。例如图3中若OXC节点B出现故障,LSR节点b就被隔离,光层的恢复机制无法对b上的业务进行恢复。由此可见,仅仅依赖下层的保护和恢复机制是不完善的,而完全依赖上层的保护和恢复机制又会引起网络结构和协议体系的复杂性,降低故障恢复的效率。因此,采用多层恢复机制有望综合两者的优点。根据多层恢复机制之间的协调关系,可以分为自下而上、自上而下和混合3种形式。
3.1 自下而上
自下而上机制的基本思想是首先在光层进行恢复,若光层无法恢复再转由上层即IP层进行处理,这种机制的最大优点是恢复时间短,例如采用类似SDH/SONET的保护机制或者WDM的保护机制,可以在很短的时间(小于50 ms)内实现倒换,而且不牵涉到高层设备和协议的参与。自下而上恢复机制的最大缺点是当下层节点设备出现故障时会导致上层设备的隔离,也即可能出现下层无法恢复再转由上层处理,导致中断时间过长。另外一个缺点是恢复的颗粒度较粗,典型的,如对于IP光网络而言,目前只能针对某个波长进行恢复。
3.2 自上而下
自上而下机制的特点与自下而上机制恰好相反,其最大的优点是能够对高层的故障进行恢复,缺点是恢复所需的时间较长(可达数秒到数十秒),同时需要较多的通信协议参与。
3.3 混合机制
混合机制的基本思路是将上述两种机制进行优化组合以便获得最佳的恢复方案。但是在具体实施过程中,针对网络故障的多样性和复杂性,如何确定一个优化的恢复策略需要仔细研究。已经有人提出多层网络中应尽力在最高层恢复;也有的文献中认为应该存在一定的顺序,例如可以采用计时器或者令牌信号加以控制和协调[14—18]。
网络中出现故障的原因非常复杂,既有设备自身可靠性的因素,也有一些不可预测的外界因素,例如由于施工或自然灾害导致的光缆切断和节点设备瘫痪等。按照“最先发现,最先处理”的基本原则,由于光层对于光信号质量高度敏感,例如光纤切断会迅速通过告警指示信号(AIS)向其他节点告警,而WDM中光信噪比(OSNR)的劣化也可以迅速被确定,通过WDM系统中的光监控信道(OSC)更是可以对故障迅速定位,因此,IP over WDM网络多层恢复机制应在光层首先动作为宜。对于上述OXC节点故障这样的光层无法恢复的情况,采用某种类似计时器的机制较为现实。考察一个网径为2 500 km(ITU-T假设的数字参考链路长度)的光网络,总计32个节点,光信号的传输延迟约为5 ns/m,单个节点对保护倒换协议处理时间约需0.5 ms[19],其总的传输延迟仍然可以满足50 ms的CDT;另一种对于时间阈值的考虑可以参考ITU-T G.114对Voice over IP类业务的规定,其端到端的延迟为150 ms。因此多层恢复机制切换的计时器的时间范围为50 ms~150 ms,具体选择多大的值作为光层进行恢复的最长门限值,需要根据网络的范围具体考虑,超过此门限后,可以再由IP/MPLS层进行处理。表1给出了几种多层恢复机制的比较。
4 结束语
IP over WDM网络选择在IP层还是光层进行保护和恢复是十分重要的一个研究课题。从故障恢复的速度来说,光层的保护和恢复机制优于IP层,特别是对于一些点到点的、业务量非常大的场合,采用保护方式优点比较明显,可以在很短的时间(小于50 ms)内应对光纤切断等故障,而且无须高层协议和信令的介入。但是对于诸如OXC节点瘫痪等故障,光层的保护和恢复机制无法处理,必须依靠IP层的保护和恢复机制参与。因此在一个规模大、节点数量多的网状(Mesh)IP光网络中,采用多层联合恢复机制是必要的。按照对故障最先发现最先处理的原则,首先从底层进行保护,若在某个确定的计时期间内无法恢复再转由高层进行恢复是较为可行的一种方法。
5 参考文献
[1] 张煦. 关于光纤传输系统 [R]. OFCIO’03.
[2] Neukermans A, Ramaswami R. MEMS Technology for Optical Networking Applications [J]. IEEE Comm Mag, 2001(1).
[3] Sano E. High-Speed Lightwave Communication ICs Based on III-V Compound Semiconductors [J]. IEEE Comm Mag, 2001(1).
[4] ITU-T G.8080/Y1304. Architecture for the Automatic Switched Optical Network(ASON) [S].
[5] Colle D. Data-Centric Optical Networks and Their Survivability [J]. IEEE JSAC, 2002(1).
[6] Doverspike R, Yates J. Challeges for MPLS in Optical Network Restoration [J]. IEEE Comm Mag, 2001(2).
[7] Kaheel A. Quality-of-Service Mechanisms in IP-over-WDM Networks [J]. IEEE. Comm Mag, 2002(12).
[8] Ramamurthy S, Mukherjee B. Survivable WDM Mesh Networks, Part I-Protection [C]. ICC’99.
[9] Ramamurthy S, Mukherjee B. Survivable WDM Mesh Networks, Part Ⅱ-Restoration [C]. ICC’99.
[10] Colle D. Porting MPLS—Recovery Techniques to the MPλS Paradigm [J]. Opt. Networks Mag. (Special Issue on Protection and Survivability), 2001,2(4).
[11] Banejee A. Generalized Multiprotocol Label Switching: An Overview of Signaling Enhancement and Recovery Techniques [J]. IEEE. Comm Mag, 2001(7).
[12] Jaafar MH Elmirghani. All-Optical Wavelength Conversion: Technologies and Applications in DWDM Networks [J]. IEEE Comm Mag, 2000(5).
[13] Kuri J. Routing and Wavelength Assignment of Scheduled Lightpath Demands [J]. IEEE JSAC, 2003(10).
[14] Tomic S. ASON and GMPLS—Overview and Comparison [J]. Photonic Network Comm, 2004,7(2): 111—130.
[15] Marco J L. Routing and MPLS Multilevel Protection: A Survey[J]. IEEE Comm Mag, 2003(10).
[16] Jia K. Two-Layer Restoration Scheme for IP over Optical Networks with MPLS [C]. ICCS 2002.
[17] Maesschalck S D. Intelligent Optical Networks for Multilayer Survivability [J]. IEEE Comm Mag, 2002(1).
[18] Demeester P. Resilience in Multilayer Networks [J]. IEEE Comm Mag, 1999(8).
[19] 毛谦. 光传送网的保护倒换技术 [C]. OFCIO’03.
收稿日期:2004-09-20
[摘要] IP over WDM网络是下一代网络的核心,生存性则是保证服务质量(QoS)的关键要素。当网络中出现故障时,选择在IP层还是光层进行保护和恢复是非常重要的课题。文章在论述IP层和光层的保护和恢复机制的基础上,提出了多层联合恢复机制的思想,针对多层联合恢复机制中各层之间如何协调进行了仔细的分析,并提出了自己的见解。
[关键词] IP over WDM网络;生存性;多层恢复机制
[Abstract] The IP over WDM network is the core of NGN, and survivability is one of the most important requirements of IP over WDM network. A good protection and restoration mechanism can resist failure and guarantee QoS at the same time. It should be decided to implement the protection and restoration mechanism in the IP layer or optical layer. This paper presents the fundamental principles of network protection and restoration in both IP and optical layers, and introduces the idea of multilayer survivability. With regard to multilayer survivability, detailed analysis on the coordination between different layers is given and the author;s opinion is also provided.
[Keywords] IP over WDM network; survivability; multilayer recovery mechanism