集中式电信业务保障操作平台的流程化管理

发布时间:2003-11-27 作者:夏海涛/XIA Hai-tao

新一代的电信网络是以业务驱动为特征的网络,业务保障逐渐成为业务供应链中突出的管理环节。简单地说,业务保障是指电信运营商为了向客户提供具有服务质量(QoS)保证的业务而从事的一系列业务管理活动。它集成面向业务等级协定(SLA)的业务性能监控、业务障碍管理和远程测试等手段,对SLA中规定的QoS目标进行测量和报告,适时地通知管理者调整业务配置,从而有效地改善业务运行环境和运行状况,提高客户的满意程度。


  目前,中国电信运营商已经开始致力于业务保障系统的投资和建设,期望籍此来优化现有的运维机制和业务结构,以在开放、竞争的电信业务市场中赢得更多的客户。为了使人们对业务保障有一个全面的了解,本文以美国电信运营商在业务保障领域的系统应用为背景,介绍它们在规划和实现集中式电信业务保障操作平台方面的流程化管理经验。

  1 电信运营图

  业务保障反映了基于业务生命周期的一个管理侧面。与网络管理的目标不同,业务管理更多关注的是如何提高客户对业务使用的满意程度,如何调配网络资源,保证QoS,并能够及时地发现和处理影响QoS的问题。由于各种类型的业务都具有独特的应用模型,不同的电信运营商在设计业务逻辑时也要综合考虑本企业的经营目标和策略,这不可避免地带来了业务管理应用的无序性,即:缺乏统一的标准或方法来指导实际业务管理系统的开发。

  国际标准组织电信管理论坛(TMF)在业务管理领域做了大量卓有成效的工作,其中最为突出的贡献就是提出了电信运营图(TOM)模型[1, 2],如图1所示。TOM由一组分层的、可重用的经营过程组成,这些过程反映了电信运营活动中独立于具体的电信运营商、技术和业务类型的操作,覆盖了电信运营活动中的客户服务、业务支撑和运行维护等方面的公共功能。除此之外,TOM还明确给出了将抽象的经营过程映射为面向业务实现的运营支撑系统(OSS)组件时可参考的输入/输出信息流。

  TOM的作用在于展现了面向业务管理的运营视图。它使用了电信运营的常用术语,从电信运营商的内部自顶向下地审视企业的经营过程,以分层的模型描述了客户服务、业务支撑和运行维护等运营环节的过程,以及这些过程如何向网络管理功能(包括配置管理、性能管理和故障管理等)进行适配。电信运营图从水平方向的视点解决了客户服务、业务支撑和运行维护过程的协作关系和支撑关系,定义了客户服务处理层、业务开发与操作处理层和网络与系统管理处理层的经营过程;从垂直方向的视点确定了基于业务生命周期的业务实现、业务保障和业务计费这3个不同的管理域。

  因此,当定制具体的业务管理应用时,可以基于TOM管理模型选取其中若干个经营过程绘制工作流程,描述各经营过程之间交互的信息,灵活地设计并实现不同粒度的OSS组件,最后仍以TOM管理模型为准绳衡量电信运营商和业务管理系统开发商在理解业务管理需求方面的一致性。

  2 业务保障系统

  SLA中规定的QoS目标是面向客户的,由客户可理解的一组指标表示,如:业务可用性、平均业务开通时间(MTTP)、平均业务恢复时间(MTTR)、失效频率(FF)等。美国联邦通信委员会(FCC) 规定了电信运营商在向客户承诺SLA时各类业务可参考的QoS指标值,各电信运营商可以根据客户的实际需求和自身的业务配置情况进一步细化指标值。如何对这些QoS指标进行定义、测量、报告,以及采取有效的措施改善业务的运行性能,是业务保障系统需要解决的主要问题。

  TOM给出了业务保障管理域的功能定义,美国的电信运营商基本都遵从TOM模型来组织业务保障功能。针对客户服务处理层发现的业务失效或服务质量降级等异常现象,业务保障系统分别启动相应的维护处理工作流程,从上到下贯穿客户服务处理、业务开发与操作处理(业务支撑)和网络与系统管理处理(运行维护)等运营层次,及时地为客户恢复业务的正常运行。此外,业务保障还包括对业务运行情况的例行检测,根据SLA的规定定期地向客户提交业务运行报告。

  一个典型的业务保障系统包括了以下的功能组件:

  (1)业务性能监控

  业务性能监控对SLA规定的QoS指标进行实时或轮询方式的指标测量、采集和处理,将性能统计的结果制成报告,为客户提供接入方式进行查询。

  (2)业务障碍管理

  业务障碍管理过滤、处理网元或网元管理系统上报的告警,通过检测、分析和隔离网络故障迅速地定位受到影响的业务及客户,在业务发生障碍之前向客户预警。业务障碍管理通常需要配备告警关联性分析的数据库和管理功能。

  (3)远程测试

  远程测试是业务保障系统中一个非常重要的辅助功能。由于现阶段很多旧的网元设备管理接口未达到所期望的开放性程度,从网元管理系统上报的性能/告警数据无法满足业务保障系统对处理数据的要求,因此,远程测试成为有效的主动测量手段。美国的电信运营商一般都将远程测试OSS软件装载在一个业务测试中心的管理操作平台上,而在网络中不同位置的网段安放相应的测试探针(Probe)硬件。中心的管理员或管理系统可以在软件平台上有策略地发起测试命令,遥控远端的测试探针对某处的业务电路或流量进行测试,测试探针形成的测试结果返回到软件平台进行集中的分析和处理。

  在实际的应用中,远程测试配合业务性能监控或业务障碍管理完成各自的管理目标。以业务障碍管理为例,电信运营商经常会遇到这样的困惑:当客户向客户服务中心申告业务障碍时,网络运行中心(即网管中心)的性能数据和告警数据却显示网络运行状态正常。虽然根据经验判断业务障碍多半发生在客户端,但是由于缺少有力的测量手段,电信运营商无法向客户提供数据证实判断。因此,在电信运营商网络和客户网络的边界处安放测试探针设备,通过业务测试中心对两端的网络分别进行回环测试,可以定位业务障碍发生在网络的哪一端,分清责任,避免无端的赔偿。远程测试的这种应用同样适用于多个电信运营商合作为客户提供一种业务时出现业务障碍所引起的责任划分。

  3 工作流程管理

  集中式的业务保障操作平台就是在一个管理中心的计算机管理操作平台上集成业务保障的所有功能软件,包括业务性能监控、业务障碍管理和远程测试。这些功能软件为可即插即用的OSS组件,由工作流程管理OSS根据一定的流程逻辑统一调度,完成自动化的、可定制的业务保障任务。

  业务保障操作平台所面临的一个重要的问题是如何解决来自不同厂商的OSS组件的互操作性。特别是在自动化的工作流程管理过程中,为了实现无人工干预的全程业务诊断和派工,OSS组件之间的接口应该具有较好的开放性。目前,国外的一些业务保障系统生产厂商已经开发了基于CORBA的网关软件,用于适配业务保障OSS组件和电信运营商的其他工作管理系统(如订单处理系统、故障工单派发系统、资源管理系统等)的接口信息,同时也通过网关软件向客户提供基于Web页面访问业务保障系统内统计数据的能力。

  业务保障操作平台所面临的另一个需要解决的问题是如何建立一套完整的业务资源数据库。一个电信运营商拥有的电路资源往往是分布在很广泛的地理区域内,分别由下属的分支机构管理和调度。建设集中式的业务保障操作平台,需要将所有的电路数据集中在一个统一的数据库中存储,通过业务保障操作平台来部署电路的分配和回收。只有这样,才能够对业务管理层出现的各种异常现象迅速无误地做出重配置的反应。中国的电信运营商普遍缺少这种企业级的资源数据库,电路的调度周期显得冗长而低效。

  在建立业务资源数据库时特别需要注意内容的一致性,即:数据库中记录的电路信息和状态必须符合当前物理电路的实际情况,电路的分配和回收必须能够真实同步地反映在业务资源数据库中。

  图2所示为基于工作流程的业务保障系统结构框架。其中,核心的OSS系统是自动执行工作流程处理过程的工作流程管理器(WFM)。WFM定义了业务保障管理域内的若干个工作流程,以流程规则的形式存储在数据库中。WFM是一个智能的OSS组件,它除了保存流程规则之外,还包括有关业务诊断策略以及所涉及的远程测试步骤等数据。这些数据事先录入到WFM的数据库中,在工作流程的执行过程中通过内置的解释器解析为可自动判决的智能操作,同时可以根据电信运营商的经营策略进行调整。测试系统(TS)是执行WFM派发的远程测试任务的OSS系统,它接受来自WFM的测试会话请求,对指定的业务电路进行测试,并将测试的结果返回给WFM。测试的过程需要调用资源管理库的电路数据,测试的目标电路标识符、测试项目等参数通过TL1(Transaction Language 1)命令传递到布放在网络中的测试探针,由探针设备上的测试软件完成物理测试。业务性能监控OSS和业务障碍管理OSS分别完成业务管理层的性能和障碍管理,它们所发现的问题成为触发维护工作流程的前提条件。从降低运营成本的角度考虑,电信运营商有时候会将这两部分功能放置到网络运行中心,和网管系统结合起来进行管理。

  远程测试的触发包括以下几个来源:

  (1)业务订单处理系统发起的安装测试请求,通常是在业务开通之前的验收阶段。

  (2)故障工单系统发起的维护测试请求,是指客户通过受理中心提交的故障申告引发的工单。

  (3)业务性能监控OSS发现的业务性能下降。

  (4)业务障碍管理OSS发现的影响业务及客户的网络故障告警。

  WFM在接收到这些测试请求之后,根据自身存储的诊断规则设计测试任务(如测试目标和测试项目等),和测试系统之间进行多轮测试会话,最终确定问题的根源。可以说,远程测试是业务保障工作流程中最关键的处理环节,是电信运营商了解自身的网络及业务状况的最有力的智能手段。

  以故障工单系统发起的维护测试请求为例,业务保障维护工作流程包括以下一些处理步骤:

  (1)工作流程管理器接收故障工单系统传递过来的维护测试请求(故障工单在故障工单系统处生成,其触发可以来自客户申告,也可以来自业务性能监控和业务障碍管理报告的严重告警)。

  (2)WFM对故障工单进行分析,判断是否具备远程测试的条件。这一步骤包括确定故障工单中的现象性质,输入的电路标识符是否合法,以及检查当前面向该电路的测试资源配置情况等。如可以执行远程测试,则向TS发起测试会话,由TS执行故障的诊断;如不可以执行远程测试,向故障工单系统返回维护测试应答,指出不可测试的原因。

  (3)TS调用资源数据库的电路数据,将测试的目标分解为远程测试探针可识别的TL1指令,发送给探针进行实地物理测试,并将探针返回的测试结果进行汇总,传递给WFM。

  (4)WFM分析测试结果,做出业务配置的部署或派工维修的决定,形成工单发送给相关的维护部门,通知故障工单系统关于该工单的处理结果并及时地监督并关闭故障工单。

  对于其他的测试请求情况,WFM执行类似的处理过程。测试的分析结果显示在WFM的界面上,通常包括分类的统计结果,如:测试正常情况、内部故障情况、外部故障情况、测试复查情况、未定义故障情况以及测试错误情况等。

  4 结束语

  美国的电信运营商通过建立集中式业务保障操作平台以及规范相应的维护处理工作流程取得了显著的成效。以数字电路业务(如:DS0和DS1)为例,1998年数字电路的MTTR指标的平均水平处于18~24小时之间,在建立了业务保障操作平台之后,2000年该指标改进为4.5~5.5小时左右。
  此后,电信运营商不断地完善工作流程环节,在2002年将MTTR指标降到了不足4小时。显然,这种改进的效果增强了电信运营商向客户承诺具有更高业务等级SLA的信心。国内的电信运营商如今面对的竞争和市场格局和90年代末美国的情况类似,因此从规范管理和提高综合竞争力等方面来说,美国电信运营商在建立集中式的业务保障操作平台方面的成功经验是值得借鉴的。

  参考文献:

  [1] 夏海涛,孟洛明,邱雪松等.重新审视 TMN?自动化的电信运营管理剖析[J].电信技术,2002,(4):3?7.
  [2] TMF GB910 Version 2.1, Telecom Operations Map [S].

  

[摘要] 业务保障是业务供应链中突出的管理环节,由于目前中国的电信运营商普遍缺乏有效的运营支撑系统,因此文章对美国电信运营商在业务保障领域的成功应用进行了介绍,并对美国电信运营商基于电信运营图设计的集中式电信业务保障操作平台的功能及工作流程管理进行阐述,希望能为中国电信运营商开展相关工作提供参考。

[关键词] 业务保障;电信运营图;运营支撑系统;工作流程管理

[Abstract] Although service assurance has gradually become a key management area in the service supply chain, Chinese telecom operators are generally lack of effective operational support systems. In this paper, successful stories of American operators in the same domain are introduced, with a detailed presentation of the functions of a centralized workflow management for telecommunications service assurance operations platform,which is designed based on the telecom operations map. The purpose is to provide corresponding reference for Chinese telecom operators.

[Keywords] Service assurance; Telecom operations map; Operational support system; Workflow management