随着新技术的应用,无线和有线网络的性能和质量有了飞速的提高,使得人们越来越习惯使用电信终端获得比语音更丰富的各类信息服务。强烈的需求给市场带来了机遇,充满个性化的各种电信增值业务需要快速的开发和投放。
与此同时,电信市场的竞争在不断加剧,而资费水平却在下降。随着传统电信业务的饱和以及互联网的渗透,单纯规模的扩张已经不能够保证运营商经营的持续发展,如何在复杂的市场环境中,提升和保持自身的核心竞争力,赢得更多的“人心”成为考虑的关键。
新的发展机遇与更加激烈的竞争摆在运营商的面前,高效的业务质量管理成为最根本的竞争要素之一。进一步地,用户体验管理(CEM)就变得十分必要,其核心价值在于实时监测用户业务体验,并在体验下降时,采取措施快速地修复故障,恢复业务质量。
以用户体验为中心的业务管理挑战
客户体验与网络管理之间的鸿沟
基于“管理承载网络质量与管理业务质量之间的差距较小”经验的业务管理方式,强调对承载网络的管理,例如在无线、核心和业务网络里组建管理团队,利用各种工具保证网络较高的可用性,以保证业务的高质量。但对于在新技术网络之上的业务,对承载网络的管理只能提供实际业务质量十分有限的能见度,使得对网络的管理与用户体验之间的差距越来越大。事实证明单纯的网络管理或优化,不能够“了解民情”,难免出现“民怨”。
业务管理中的故障定位问题
业务系统总有出现故障的时候,即便我们掌握了一种方法能够察觉到用户体验的下降,但如果不能快速而准确地定位并解决故障,用户对产品和品牌的体验同样很差。
从海量的资源告警中甄别出真正导致业务质量下降的故障源不是一件简单的工作;同时,造成体验下降的原因很多是由于不当的配置造成的,这种问题较为隐蔽,很难被发现。另外,经验在故障定位中十分重要,但由于信息分散,未被恰当地利用,没有形成供应商和运营商的合力。
业务管理方式的三个方向
目前,业界存在三种业务管理方式,即由TMF提出的“经典业务管理”、以拨测为代表的“主动业务管理”和以业务数据包分析为代表的“用户体验管理”。
“经典业务管理”方式在管理服务访问点(SAP)不固定的业务时,因为端到端路径在网络中十分复杂,以至于很难建立业务质量与资源性能指标的关联关系。
“主动业务管理”是现有测试和测量系统的自然演进,此种方式不可能在所有的业务接入路径上进行仿真测量,无法同时掌握全网用户体验。
“用户体验管理”是一种建立在直接采集、归纳和分析业务数据流技术之上的管理方式,它能够直接推导出用户体验。但是由于终端的多样性以及抓包分析技术大多只能针对IP网络,因此不得不缩短被管理的“端到端路径”长度,从而降低了准确性。
以上三种方式在故障定位和解决方面没有给出明确的方案,使得以用户体验为中心的业务管理未能形成闭环,体系不完整。
中兴通讯CEM方案的业务管理思路
业务管理的核心命题
中兴通讯作为业界少有的全业务产品的供应商,在和运营商合作的基础上,根据多年来积累的经验,认为用户体验管理存在三个核心的命题,即:及时发现、快速定位和专业排障。他们环环相扣,形成完整的业务管理体系。
● 及时发现问题是指为业务质量寻找到一个合适的“体温”测量仪,实时地反映用户对业务质量的体验。
● 快速定位是指当业务“体温”不正常时,能够通过一系列的“化验检查”,并根据经验快速高效地诊断出可能的“病因”。
● 专业排障是指当找到“病因”后,能对症下药,给出解决问题的专业建议或直接解决问题。
中兴通讯CEM的三层指标体系
围绕以用户体验为中心的业务管理,中兴通讯创造性地提出了一个三层指标模型,如图1所示。
图1 中兴通讯CEM方案三层指标体系
如图1,最顶层是用户体验,采用用户体验指标(CEI)来表示,他们就是业务质量的“体温计”。通过这些指标,我们就可以实时地了解用户对业务的感知,从而监测业务的质量。
第二层是网络质量指标(网络KQI),是用户体验在承载网络中的具体表现。CEI由KQI聚合而成:即每一个CEI都由多个KQI根据特定的算法计算得出。KQI反映的是网络指标,其来源包括关键位置的抓包分析数据、网管数据等。
第三层是网络基础数据,他们被用于诊断故障。具体地讲,当用户体验下降时,必然表现为KQI的下降,当KQI下降到某一阈值时,一个专家系统将开始工作,它会根据知识库提取、分析各类网络基础数据,以便诊断出故障的根源。这些基础数据来源更加广泛,涉及到网管中的告警、性能、配置数据,抓包分析数据,以及话单数据等。
从网络KQI到CEI“直取”用户体验
针对一个具体的业务,首先拟定用户体验指标,他们可能包括用户对业务接入、保持、流量和延迟的感知。然后,根据每个CEI在端到端网络中寻找合适的KQI,并确定这些KQI和CEI之间的计算关系。对数据业务而言,一般采用抓包分析的“用户体验业务管理”方式能直接获取到网络KQI,这样可以实时地、较为准确地捕获用户的感知。当然,根据实际网络的特点,采用“经典业务管理”方式从网络基础数据中聚合得出网络KQI,在推导出用户体验CEI这是可行的,只是没有前者简单高效。
专家知识为网络“诊断病因”
根据事先积累的专家知识,为每个KQI的下降制定一个故障诊断流程,所有这些流程的集合就是专家系统所依赖的知识库。当业务质量下降时,专家系统将开始工作,直到找出故障源,给出修复建议。故障定位流程包括触发、计算、更新三个阶段。
触发:每个KQI的下降都可能有很多原因,他们或同时或排他地出现,但在实际网络中出现的概率肯定是不一样的。这样,我们通过决策树算法,按照故障出现的概率及判断方式形成诊断决策树,以达到高效定位故障的目的一旦某个KQI越限,那么就会触发故障诊断过程。
计算:诊断计算过程直接采用业界领先的决策树算法,按照决策树中每个结点所指示的判断条件,比较网络KPI与判断值的关系,并根据比较结果不断探索可能的故障原因,直到最后到达叶子结点或找不到合适的结果。对于通过决策树找不到结果的情况,需要人工干预,由专家继续根据网络情况排障。
更新:如果在决策树中找到了合适的结果,那么该叶子结点对于解决这个问题的概念会发生变化,从而导致决策树发生调整,将概率高的叶子结点调整到优先的比较路径中去。如果是通过人工干预的方式找到了新的故障源,那么需要更新决策树,把新的排障路径添加到树中,以便在下次的诊断过程中系统能自动化地判断。
该专家系统是一个自学习、自适应的系统:当有新的故障源被添加到系统中后,系统会自动赋予它一个初始的概率,重新根据决策树算法更新决策树。同样地,当造成某KQI下降的各种原因的概率发生变化时,为了保持高效的诊断过程,决策树也会自动更新。
中兴通讯CEM方案在GPRS业务中的应用
目前,中兴通讯CEM方案正在广东联通GPRS业务端到端管理项目中得到应用。在该项目中,我们找到的CEI、网络KQI如图2所示。在无线网络侧,我们采用了“经典业务管理”方式,按照协议层次从大量的网络KPI中聚合形成了用于支撑4大类CEI的KQI;而在有线网络侧,我们采用“用户体验业务管理”方式,按照业务流程的各个环节在Gb口抓取业务数据包进行分析,直接获取支撑CEI的KQI。两种方式的结合,有效地发挥了各自的优势,使得用户对GPRS业务的体验被实时地、准确地捕获,从而直观地了解GPRS业务的“健康”状况。
图2 GPRS业务CEI、网络KQI,及其对应关系
另一方面,根据中兴通讯在GPRS业务建设和代维工作中的经验,我们找到了数百个典型案例,为各个KQI找到了最常见的故障源,并绘出了各自的故障诊断决策树。随着这个专家系统在实际网络中的不断学习,它会越来越显著地提高故障定位的效率。
通过这个系统,运营商能够及时地发现用户业务体验的下降,并且能够高效地定位问题所在,促使运维人员快速修复问题;前台业务人员更加友好地、主动地进行客户关怀,最终提升用户满意度,改善品牌体验,赢得“人心”。
赢得更多“人心”的业务管理关键点
有几个因素被认为是对建设以用户体验为中心的业务管理体系十分关键的,只有建设者理解并能付诸于实践,目标才是可达的:
● 理论联系实际,建设有自身特色的管理体系。理论知识不能教条化的理解,包括TMF所提观点在内的信息只能作为建设的参考。
● “懂技术、懂业务、懂产品、懂服务”。建设者必须熟悉业务,理解业务,深知业务在技术和提供层面上的关键点。
● 丰富的运维经验。前面提到,在实际运维中,尤其是故障定位过程中,经验是十分重要的。具有经验,并能运用于解决问题者才能成功。
● OSS数据采集、归类、过滤和分析技术的积累。如今的承载网络已经十分复杂,再加上供应商在很多技术上尚未统一和标准化,因此在数据处理底层的能力也显得十分重要。
体“民情” 夺“民心” 得“天下”
从以往的经验与市场发展的趋势来看,关注用户体验是3G浪潮下业务成功的基石,唯有最快地、最真实地了解用户的感受,才能做到“知己知彼,百战不殆”;唯有建立快速而有效的故障定位和解决机制,才能做到“亡羊补牢,未为晚也”。
有必要指出的是,在新的市场需求被激发后,对业务管理的思路探索和系统建设应该被放到和新产品、新业务开发同等重要的位置,从发达国家运营商的经验来看,从管理中得效益,推出精品产品才是步步为营、维护自身品牌的长久之计。
中兴通讯作为一个全业务产品供应商在这方面积累了相当多的经验,所提出的CEM方案有能力为运营商的业务管理助力,助运营商赢得更多的“人心”。