提升业务质量的可度量性与可治理性——中兴通讯端到端性能管理方案

发布时间:2023-04-21 作者:董月霞,高原,张建(中兴通讯)

网络运营模式由粗放式带宽租赁经营向精细化分级质量运营转变,增值业务种类不断增加,这些变化对网络质量提出了挑战,使得网络质量的可度量化、可治理性成为网络运营维护治理的重中之重。网络性能质量测评是可度量化、可治理性的基础,建立网络质量测评体系是网络高效运营的核心。

    当前,以用户感知质量为目标进行网络性能衡量已逐渐被业界接受,在这样的趋势下,端到端性能管理是实现网络可度量化、可治理性的必由之路。

传统性能管理方案的局限性

    端到端业务质量管理的内涵是在原有网络管理的基础上把管理范围扩大到业务。端到端具有两层概念,一层是水平方向,从用户到用户或者是用户到服务器水平的端到端覆盖;另一层是垂直方向,从承载层到业务层纵向做好业务质量管理。传统的性能管理方法按照业务专网划分,往往导致了这两个方向的割裂。

    ● 水平方向的割裂:一个用户到用户的业务需要基于各个不同业务专网的资源,对此服务路径上的各个资源单独进行性能评测并不能反映出实际业务质量。

    ● 垂直方向的割裂:传统的网优只是提高某一个域内的网络质量,将网络分割开考虑。这种网络优化方式虽然在一定程度上可以提高业务质量,但整体效果不是最优的。分域管理导致问题定位与解决工作周期冗长,一些业务质量问题往往需要在各个业务专网的运维团队中多次流转才能发现具体原因。运维团队无法预先发现故障,往往疲于应付用户投诉,运维效率低下。

    在3G时代,随着IP网络的发展,最初以承载为主要功能的IP网络正逐渐转变为以增值业务运营为主要功能的网络。新业务的发展不断给网络提出更多的挑战,传统网络规划和网络质量管理缺乏可靠的依据和手段,也难以测评现有网络性能对新业务的支撑情况。

端到端性能管理方案

    中兴通讯作为业界少有的全业务产品供应商,在和运营商合作的基础上,经过多年来的经验积累,提出端到端性能管理方案。端到端质量管理主要面临两大核心问题:其一,用户到用户的水平端到端联系,即不是孤立地提供单个设备的性能指标,而是在用户所用服务所需的“服务路径”上进行性能测量;其二,突破业务专网的分隔,面向业务建立跨业务专网的性能指标分析体系。中兴通讯端到端性能管理方案,突破了传统性能管理的局限,解决了上述两个核心问题,实现了全路径跨多专业网的完整端到端管理。


完整的承载模型

    业务质量是一个具有广泛意义的概念,可以将业务质量分解到系统中不同的域和不同的层中。只有当完整考虑端到端的时候,这个概念才有重要的实际意义。端到端的服务质量是由网络中的不同设备将质量需求映射为一个合理的配置而获得的。

    承载模型描述了网络各个层间的服务与彼此影响的关系,具体来讲就是描述了设备以及该设备对其他服务的依赖关系。同时也描述出水平与垂直方向上的关联关系,以此为基础来解决普通性能分析方法存在的割裂问题。

    传统的资源管理是以业务网类型进行分类管理,从设备类型维度进行组织的,其局限性在于:

    ● KPI计算是独立的,不能全面地反映网络质量;

    ● 不能描述设备的相关性及链路等信息。

    而用户感知的服务,往往涉及诸多专业网环节。以数据业务为例,通常可以包括:核心网侧设备、无线侧设备、SP服务器三个主要环节。实现端到端管理首先要从承载层面打破传统的以专业网为维度的管理方式,实现跨专业网的完整的承载模型,以数据业务为例,其承载网的完整承载模型如图1所示。





 图1  完整的承载网模型示意图

    完整的承载模型同传统的承载模型相比存在如下改进:

    ● 从服务的角度入手组织资源,而不是从设备类型入手组织资源。

    ● 比传统承载模型涉及的业务类型更宽泛。例如为了能够实现端到端的数据业务管理,除了核心网和无线承载网外,还必须引入互联网中提供各种上层服务(FTP、WWW、WAP等)的服务器资源。

    ● 体现了“服务路径”,即实际承载服务的具体资源链。传统的承载模型,是水平面上的一种割裂,即每个水平面上是一种专业网网络设备,独立管理,没有对专业网之间的“路径”关系进行充分描述和体现。而服务路径的出现使得各种业务网之间建立了纵向的映射,从而为端到端实现了完整的承载模型。如图2所示,此为从基站、微波、BSC到核心网的服务连接路径。



 

 图2 完整的“服务路径”示意图

    完整的承载模型,为实现业务端到端的衡量从资源层面提供了有力支撑。而指标衡量方式是否能够基于完整的承载模型,实现跨业务网层面的关联分析才是能否实现业务质量端到端衡量的另一个关键因素。


基于承载模型的关联指标

    现有的网络KPI能从系统的角度来衡量网络的工作状态。一般可以将网络KPI划分为无线接入网络KPI和核心网KPI两类。

    无线接入网络KPI代表了无线接入网络是如何工作的。无线可接入能力和保持能力是衡量一个用户在使用某个业务时接入并保持无线资源好坏的典型测量指标。

    核心网KPI给出了移动性管理进程的性能。这些KPI能测量传输接口和网元的负荷,以确保核心网能支持无线接入网络的资源需求。同时这些KPI也反映了网络中的瓶颈,因为通常成为网络规划升级的依据。

    在传统性能管理中,上述KPI指标往往都是离散的,需要依靠运维优化团队人为关联分析。中兴通讯提出的基于业务关联性的指标分解体系,按照“服务路径”将各层KPI进行分解与关联,建立不同业务领域设备间的指标影响关系,从而全面评测业务质量,并能迅速发现与定位问题。以语音业务为例,业务指标分解如表1所示。

 表1 语音业务指标分解架构图




    依据上述分解架构图,以语音失败率为例,呈现的指标分解示意图如图3所示。




 图3 关联KPI分析示意图

    此分解体系的优势在于:

    ● 环节可关联。影响一个业务质量的环节众多,通过将不同业务专网的不同环节(设备/接口)进行关联,发掘出性能指标间的影响关系,从“业务路径”的角度进行性能衡量,达到了对业务质量精确评估的效果。

    ● 问题可追溯。通过此指标分解体系能全面了解现网的业务状况,发现有问题的部分,并迅速定位问题。

    至此,在完整承载模型基础上完成指标关联分析,实现对“业务路径”的准确衡量,并支持故障的迅速定位,从而实现对业务质量的可量度性和可治理性。


端到端性能监控机制

    网络体系中任何一层的问题都可能导致服务质量的劣化,通过对各层质量指标的关联映射,并最终汇聚到业务指标,这为端到端质量管理提供了多方面支撑。

    在完整的承载模型上,监控各环节资源情况,并监控关联KPI,从而实现端到端的性能监控:

    ● 连续监控资源参数与状态;

    ● 连续监控资源上承载的业务的状态;

    ● 发现并分析、解决问题。

应用案例

    目前,中兴通讯端到端性能管理方案已在埃塞电信国家NOC中心得到应用。在端到端质量管理中,面向语音与短信的指标分解树被用来进行业务监控。来自核心、无线等业务专网的多个设备及其关联指标被纳入该端到端性能监控体系。该监控体系不但能进行业务单元的性能监控,而且还提供了基于网络拓扑结构与服务关系的“服务路径”监控。基站、电源、微波、传输直到核心网设备都纳入了统一的监控体系,业务相关、服务承载、动力支撑等关联关系被统一整合,使运维人员及时、准确地掌握业务状况,提升运维效率,降低运维成本。

 

[关键词] 网管