基于业务分布的传送网网络预警分级机制的应用

发布时间:2006-01-19 作者:韩文善,李斌

随着电信业的飞速发展和竞争的日益激烈,内部业务网络和出租专线网络对传送网电路可用率的要求日益提高。

      传送网运行状况的优劣,直接影响其向上给业务层提供业务的能力,也间接决定了整个通信网络满足人们通信需求的质量。然而,出于减少电路转接跳数和提高资金回报率的考虑,在干线建设时,跨度很大的SDH自愈保护环被较多采用,有的环路甚至长达6 000 km,如何避免一个SDH环上不同复用段同时出现故障点而导致业务中断,是当前人们普遍关心的问题。

    当传输网络某一点发生故障导致网络安全性降低时,网管中心向网络其他部位的维护者发送警示信息,告知网络上已经发生故障,提醒其他部位的维护者需要对自己负责维护的区段重点保障,是目前行之有效的避免出现第二故障点的方法之一。

    预警信息通常包含以下内容:

  • 当前已发生故障点的位置和影响。
  • 造成网络业务损失的描述(如果接受者维护区段同时发生故障)。
  • 接受者收到预警信息需要采取的措施。

    本文将试图找到一种对上面提到的多点故障造成网络业务中断的情况进行评估的方法,并根据评估的结果得出应该发送预警信息的重要性级别。

1 业务中断事件对网络影响的指标

1.1 电路集划分
    根据网络中的电路提供通信能力的情况,可以把电路划分为两类:正常电路集N 和失效电路集F 。所谓失效,是指因主用路由和保护路由上的某些构件(如光缆段或机盘)故障,而导致电路的正常通信能力丧失的现象。

    失效电路集由所有失效的电路组成。相应的,正常电路集为全网所有不属于失效电路集的电路组成。那么,电路全集A =N ∪F。

    假定网络中有n个站点,还可以根据失效电路的起始站点归属,将电路全集A分成n个子集A i,i =1,2……n,起点或者终点落在站点i 的电路属于电路集A i。电路集A i内的失效电路构成的集合为F i。那么,F =F1∪F2……Fn,F i =A i ∩F,i =1,2……n。

1.2 评价方法构造原则
    发送网络预警首先需要解决的问题是如何简明扼要形象贴切地刻画业务中断事件造成的网络业务损失,也就是对业务损失进行评价(量化和分级)。

    构造一个业务中断事件的评价方法,应该遵循以下原则:
    (1)可比性原则
    评价方法所得到的评价结果应该是一个定量的结果,可以方便地进行纵向和横向的对比。

    (2)面向用户原则
    网络是为了给用户提供通信业务,所以运行质量的评价应该基于所提供的这些业务,以网络业务提供能力为导向。

    (3)易操作性原则
    所构造的评价方法应该可以在真实的网络环境下进行实施。

    (4)简单性原则
    在实施的评价方法中,计算过程不应过于复杂。结果应简单明确,易为维护人员直观理解。

1.3 影响业务中断事件评价的因素
    为了全面准确地评价业务中断事件,需要分析影响评价结果的因素。影响评价结果的主要因素有:
    (1)失效电路集
    要摸清业务中断事件导致多少条电路不能正常工作。

    (2)电路的权重
    根据每条电路的速率、业务类型的不同,赋予相应的权重Wi。

1.4 评价指标的确定

1.4.1 业务中断指数的确定
    对业务中断事件最简单的评价方法就是给出失效电路集内包含的电路数目,但是它不满足可比性原则。比如网络开通初期,电路全集A 内包含100条电路,如果中断电路集包含20条电路,中断事件绝对应该算得上影响巨大。但随着网络规模不断扩大,电路全集A包含了1 000条电路,如果此时中断电路集包含20条电路,那么,中断0.2%的电路应该只能算是个小事件。可见,绝对中断电路数目不具备纵向可比性。可以采纳相对中断电路比例来提高评价工作的纵向可比性,这就是业务中断指数(TFI)。

1.4.2 最大业务阻断率的确定
    单独使用TFI对业务中断事件进行评价还存在客户网络感知问题,同样是中断全网电路5%的事件,如果中断的电路均匀分布在多个局站的多个局向,对每个局站的影响都比较小,客户网络感知不明显,但如果中断的电路集中在一两个局站,则有可能造成这一两个局站的出局电路几乎全部中断,相关客户网络将受到较大的冲击。

    如前所述,对于任一局站,可以得到它的电路全集A i和中断电路集F i,那么由此来计算该局站的业务阻断率,描述业务中断事件对局站i 产生影响的大小。所有站点业务阻断率的数列BR ={BR1,BR 2……BRn}可以准确刻画中断电路的分布情况。也可以取数组的某些统计特征数值来替代数组本身对于业务中断事件的评价,本文采用的是最大业务阻断率(MBR)。

    MBR描述业务中断事件对客户网络的影响情况。TFI与MBR有互补性,可以准确贴切地描述故障所造成的客户网损失。TFI侧重于刻画业务中断事件对全网的影响大小,而MBR偏重于刻画对单个局站业务的影响大小。

1.4.3 电路重要性权值
    由于每条电路速率、用途不同,电路的通信能力所带来的经济效益和社会效益必然有所不同。并且不同客户网络的业务迂回保护能力不同,对电路的可用率要求也有所不同。根据速率、用途等特征给每一条电路赋予重要性权值Wi,比如国际电路和信令电路具有较高权值,互联网电路和话音电路具有较低权值。

2 评价指标与预警等级的关系
    由于预警信息需要以某种方式向维护者发送,要求预警的各方面内容都简洁易懂。
可以根据TFI和MBR把预警分成一级、二级、三级,用预警等级代替TFI和MBR这些不易理解的数值。还可以根据预警的等级,与预警接收者事先约定收到预警信息后需要采取的措施。

2.1 确定TFI和MBR阈值的流程
    在确定了TFI和MBR两个指标之后,需要解决的问题就是TFI和MBR大小与预警等级的关系,也就是确定它们的阈值。确定阈值的流程如图1所示。

2.2 对TFI和MBR进行统计
    在传输网上选取13个有代表性的复用段作为样本。对这些复用段本文进行了仿真,并计算了这些复用段发生光缆故障与其环相关复用段故障共同作用时产生的TFI和MBR值的大小。

    比如1号复用段,有24个相关环复用段,可以得到24个TFI和MBR数据,然后再统计它们的大小分布,计算出的TFI值大于5%的复用段有11个,TFI值为5%~10%的复用段有6个,TFI值为10%~15%的复用段有4个,TFI值大于等于15%的复用段有3个。如表1所示。

 

    同样地计算MBR,MBR值为<10%、10%~20%、20%~30%、30%~40%、40%~50%、50%~60%、60%~70%、70%~80%、80%~90%、90%~100%的复用段分别为8、2、3、2、2、2、2、1、1、1个,如表2所示。

2.3 确定阈值
    根据表1的TFI分布情况和表2的MBR的分布情况,以及对各级预警数量比例的期望,暂定TFI和MBR与预警等级之间的对应关系满足以下两条规则:
    (1)分别由TFI和MBR计算预警等级,阈值见表3、表4。

    (2)取表3和表4所确定的预警等级中高等级者。

2.4 验证以及调整
    2005年1月—9月份,13个复用段产生的线路故障次数如表5所示。

 

    根据故障次数和指标与预警等级的关系,需要发送的预警条数如表6所示。从表6来看,9个月将发送一级预警108条、二级预警128条、三级预警168条,数目基本合理,只是一级预警稍多。108条已经发送的预警中有56条是由4号复用段出现8次故障引发的。4号复用段处于网络关键部位,受台风等自然灾害影响故障频繁,是网络安全的一个薄弱环节。

 

3 结束语
    本文通过对网络第一故障点潜在影响的评估,找到一种在网络发生单点故障后,通过分级发送预警的方法。通过该方法可以提高传送网络承载业务的安全性。

收稿日期:2005-11-07

[摘要] 传送网运行状况的优劣,直接影响其提供业务的能力,因此应避免一个SDH环上不同复用段同时出现故障点而导致业务中断。方法是当传送网某一点发生故障导致网络安全性降低时,网管中心向网络其他部位的维护者发送警示信息,告知网络上已经发生故障,提醒其他部位的维护者对自己负责维护的区段重点保障。通过对多点故障造成网络业务中断的情况进行评估,得出预警的重要性级别,并结合网络历史运行数据对预警分级修正,从而提高传送网络承载业务的安全可靠性。

[关键词] 业务中断事件;业务中断指数;最大业务阻断率;客户网络

[Abstract] The capability of a transport network to support traffic is directly affected by its transport status. Therefore, simultaneous traffic failures at different multiplex sections in one SDH ring should be avoided, because they may break off the service transport. The solution is that when a traffic failure occurring at one point on a transport network has worsened the network security, a warning message is sent to maintenance people of other sections of the network to impart the failure and remind them to strengthen the section maintenance. Based on the evaluation of service interruptions caused by simultaneous traffic failures at multiple points on a transport network, the warning is graded by importance. The warning grades are further modified according to the history operation data of this transport network. In this way, the security and reliability of traffic on the transport network is improved.

[Keywords] traffic failure event; traffic failure index; maximum block ratio of traffic at a site; client network