虚拟化网络智能运维

发布时间:2017-10-30 作者:巫江涛(中兴通讯)


中兴通讯MANO产品总工 巫江涛

 

  在ICT融合的大背景下,电信运营正由相对单一的传统通信业务运营向数字化运营转型,SDN/NFV为这种转型提供了技术基础。基于SDN/NFV构建的电信网络具备弹性、可编程、开放等诸多极具想象力的特性,将使电信业务敏捷化、多元化、数字化,进而激发出蓬勃的电信业务生态。据IHS调查分析,81%的运营商表示将在近两年部署SDN/NFV网络,领先运营商如沃达丰、德国电信、中国移动等将在2017年实现SDN/NFV网络商用,虚拟化网络已处于规模商用前夕。


  虚拟化网络围绕数据中心进行建设,运维集中化是必然趋势,这是组织架构层面需要解决的问题。另一方面,虚拟化网络引入了更多的网络层次,新开辟了更多的专业领域,这也必将导致其运维的难度会较传统电信网络更高。


  虚拟化网络运维中最突出的几类问题分别是:一,如何进行故障溯源,在网络故障发生后,快速定位故障并排除故障;二,如何使网络资源得到最优化使用,对资源进行动态调整,提升资源利用率,并使用户体验达到最优;三,如何保证网络安全。


  中兴通讯通过引入人工智能技术,以应对解决虚拟化网络运维中的关键难题,携手合作伙伴实现虚拟化网络智能运维。作为全球领先的电信设备与电信服务提供商,中兴通讯对电信网络有着深刻的理解,在SDN/NFV领域已走在最前列。结合虚拟化网络运维特点与难点,中兴通讯打造了一个可视化编程的人工智能平台,该平台具备可视化AI编程环境,支持各类传统机器学习算法,同时也提供了丰富的深度学习算法;该平台支持分布式GPU集群,可对AI模型进行并行训练。应用该平台可为具体的应用场景快速搭建出相应的AI应用,结合平台提供的模型评估、推理等工具,可快速完成模型训练、评估、优化等工作,大幅降低AI应用开发门槛,有效提升AI模型训练效率,是虚拟化网络实现智能运维的加速器。


  基于对SDN/NFV运维的理解,中兴通讯已基于该平台开发了两大关键应用,可在虚拟化网络中部署使用,解决虚拟化网络运维的实际问题。


● 关键应用一:智能保障


  智能保障主要解决虚拟化网络的故障溯源问题。智能保障的关键技术是告警根因分析,在虚拟化网络中,自底向上有硬件告警、虚拟化层告警、应用层告警、管理系统相关告警等,横向各网络域告警跨了无线接入域告警、承载网络域告警、核心网域告警等。当系统发生故障时,会有诸多告警涌现,如何在海量涌现的告警中,识别出其根源,是快速解决故障的关键。中兴通讯结合海量网络运维实践数据、虚拟化网络数据,使用机器学习算法解决了告警根因分析问题,使得部署了智能保障的网络可以自动进行故障根因的关联和推导,一方面系统可利用已经学习到的告警关联知识进行大部分故障的快速根因分析,另一方面通过自动关联推导结合运维人员的确认动作,可以不断扩充告警关联知识库。在实践中发现,通过引入机器学习,可将告警根因关联规则提取效率提升70%,极大提升了虚拟化网络的故障处理效率。

 



  未来5G网络中,网络功能按需编排,运营商可根据不同场景和业务特征要求,灵活组合功能模块,网络功能的部署形式将更加多样化,对故障溯源提出更高要求。在5G网络的运维管理中,智能保障将是实现智能运维的基础。本着开源开放的精神,中兴通讯计划将该关键技术开源贡献出去,在开源项目ONAP立项的Holmes正是承载了我们这样的愿望。


● 关键应用二:智能策略


  智能策略主要解决虚拟化网络的资源最优利用问题。用户对网络的需求具有随机性和突发性的特点,随着大视频、VR、物联网等技术的普及应用,网络流量及信令负荷将持续提升,网络需要适时进行动态调整,或进行弹性扩缩容,或调整选路分担业务负荷,才能满足这种动态变化需求。智能策略通过机器学习技术,对海量历史数据进行学习,得到业务负荷变化模型,以及相应的业务负荷与资源的匹配模型,结合模型以及业务负荷变化趋势,推导出资源调整动作,进而触发编排系统执行相应的资源调整动作,完成资源优化调整,从而实现基于智能策略控制的自动化闭环运维。即时的资源优化调整,结合实际负荷需要,有多种实际触发动作,可以通过编排系统对网络进行弹性伸缩,可以通过SDN对网络进行智能路由调整,也可以通过配置激活系统对网络配置数据进行调整。这种方式既实现了网络资源的最佳利用,同时也提升了用户的业务使用体验。另一方面,针对中长期的变化趋势,可以结合智能策略的趋势报告,及时采取硬件扩容等实施周期较长的措施。


  在5G网络中,随着大流量、高并发等业务场景的成熟,部分转发面功能将下沉到边缘数据中心,资源的快速精准调度将关系到用户体验和业务发展。应用智能策略对资源实现快速精准调度,将有效提升5G网络资源效率与用户体验。

 

  虚拟化网络所固有的软件特性,有利于人工智能相关技术手段与其结合,产生更大价值。随着虚拟化网络商用规模的扩大以及5G网络的发展,不断催生的虚拟化网络运维的需求将持续促进网络运维的智能化、自动化。更进一步,人工智能技术应用在虚拟化网络运营领域,将激发出更多的想象力与可能性,智能运营也许并不遥远。