基于云化网络的下一代运维方案

发布时间:2017-08-21 作者:汪锐,刘军杰(中兴通讯)

转型浪潮

 

  SDN/NFV技术的发展,给电信网向智能化自动化网络转型带来了新的契机。大数据分析、人工智能(Artificial Intelligence,AI)、集中化策略驱动、用户体验管理等技术和理念成为运维领域关注的热点。


  在云化背景下,资源可编排使得资源可以灵活调度,网元设备从传统设备全面转型为虚拟化设备,虚拟化网元被虚拟机所承载。云平台汇聚计算、网络、存储资源,形成统一管理,基础设施可以编程,即基础设施自动化(infrastructure as code)。NFV通过云化实现软硬件解耦及功能抽象,使网络设备功能不再依赖于专用硬件,资源可以充分灵活共享,实现新业务的快速开发和部署,并基于实际业务需求进行自动部署、弹性伸缩、故障隔离和自愈。云化、数字化、自动化、智能化技术未来的发展前景可期,同时也面临挑战。


  咨询机构TBR(Technology Business Research)2016年发布的一份有关全球电信服务市场的报告中总结了NFV运维的主要挑战:


● 贯穿物理系统、虚拟系统、混合系统的运维流程;


● 为主动式网络运维设计的深度建模;


● 基于实时性、内容和地址感知的运维方法和全新的SLA体系;


● 跨越物理和虚拟网络的流量可视化管理;


● 跨厂家、跨网络层次的综合性管理。


  基于以上趋势和挑战的分析,中兴通讯提出了基于云化网络的下一代运维解决方案vMaster。

 

云化智能

 

  中兴通讯下一代云化运维解决方案vMaster提供云化网络集中管理:统一信息模型管理、策略模型、业务模型、资源模型,实现全网、跨厂家的端到端全局管理;统一门户管理,形成统一视图,包括统一的告警、性能视图和资源视图。vMaster提供了一个开放式服务保障管理平台,帮助运营商集中管理多厂商、多专业及SDN、NFV网络,提供集中告警、集中性能管理,统一运维流程管理,形成快速、灵活、低成本、高效的运维网络。vMaster全部功能组件微服务化,在基于云的PaaS虚拟化环境下运行,以便提升管理规模,并提高系统的灵活部署能力,满足敏捷部署要求。vMaster解决方案通过网络的集中管理,实现端到端故障、性能的综合分析和展现,集中一套数据,节省资源,便于关联分析;通过策略中心的运维策略和编排调度策略,实现从编排到保障的闭环管理。


  中兴通讯下一代云化运维解决方案vMaster引入AI大数据智能化分析,可实时动态调整策略,并监控策略执行效果,不断优化策略。AI从大量历史事件中通过大数据分析规律形成策略;策略在事件的驱动下,自动优化网络设置(包括自动扩缩容、自动网络带宽调度等)。这是一种智能化的运维方式,网络运维从分析和计算实时现状,再做运维决策的方式向提前预防式网络维护转变,即从“计划”演进为“主动”和“预测”。AI通过总结经验,学习运维人员的相关知识,来改进其在运维中所采取的策略及方式,帮助运营商将网络配置和监控过程自动化,减少运营支出。


  告警过滤和根故障分析是告警处理的核心工作,网络复杂并且告警数据量大,传统运维方式需投入大量人力分析根故障规则。如今AI的引入解决了这个问题,AI通过对历史告警的分析,并通过机器学习生成根故障规则,通过告警恢复验证其规则的有效性。中兴通讯和某运营商合作,收集整理运营商网络中1000万条历史告警,通过无监督的机器学习实现告警过滤和告警关联分析。通过参数的不断调优和算法参数定界,只需要10分钟就能生成62条有效告警关联规则,覆盖承载网、核心网、无线接入等各个领域。反观传统告警关联规则梳理过程,需要6名专家投入几周时间,且跨专业的告警关联往往难以梳理。中兴通讯下一代运维系统,仅需10分钟,就能分析出专家几周才能分析出的结果,并快速投入使用,大大提升效率。


  弹性扩容方面,当vMaster明显感知事先部署的虚拟化网元转发压力加大时,网元的I/O吞吐会超越基线,vMaster策略中心通过性能预测判断,自动决策需要弹性扩容,通知编排系统驱动实现弹性扩容。运维系统跟踪弹性扩容效果,在一个时间窗内检查虚拟化网元KPI是否下降到合理水平,检查弹性的效果。如果弹性失败,继续扩容,并通知人工检查弹性策略配置。


  自动化闭环实现了业务的自动修复,但无法回避无法自动修复的问题,如硬件设备故障等。当运维中出现硬件故障时,vMaster下一代运维系统通过故障识别,将故障形成工单指派给人工进行修复。同时,通过对自动提单、指派、资源调度、运维路径等的维护策略设计,再通过AI互助策略执行,有效提升人工闭环过程中各环节的处理效率。

 

  当AlphaGo战胜人类那一刻,智能时代就已经宣告来临,AI将在更多领域发挥作用。AI在运维领域的应用已初见端倪,中兴通讯下一代运维系统将提升运营商运维体验,提升运维自动化水平,助运营商成功实现网络转型。