面向5G承载网的智能运维

发布时间:2019-08-22 作者:岳朝虎 中兴通讯

随着5G和云时代的到来,新兴业务模式层出不穷,电信行业作为各行业数字化转型的引擎,将迎来巨大的商业机遇,同时也面临更多挑战。由于网络规模和复杂度的持续提升,传统基于人工的网络管理运维方式已经不能适应业务的发展需求,急需提升运维系统自动化和智能化能力,以提高网络部署和运维效率,降低OPEX。

中兴通讯SDN智能管控系统作为业界首个真正基于云原生架构的管控系统,集编排、管理、控制和分析于一体,适用于PTN/SPN、IPRAN、OTN、IP承载网全系列产品,可提供强大的资源集中统一调度,实现承载网络高达30万以上等效网元的管理,并基于AI和Telemetry等技术提升网络智能感知和控制能力,实现5G承载网自动化和智能化运营。

智能网络部署

中兴通讯SDN智能管控系统可使5G承载网络具备快速构建能力,通过智能化业务自动快速发放,将部署周期缩短至分钟级,极大降低运营商OPEX。

-网络快速构建
设备加电开通后,通过DCN自动上线,实现免进站免配置,拓扑自动生成,网元、单板、链路自动发现;实现基础数据快速部署,模板灵活定制和一键式配置,提升SPN网络基础配置效率。

-业务自动发放
管控系统基于标准的北向接口对接,实现电子工单信息从综合资管系统自动下发至管控系统,实现业务的配置自动化。相对于传统人工配置方式,业务上线时间从小时缩短至分钟级,同时,可实现跨厂家、跨域业务端到端自动化编排和基于策略的智能化业务路由,极大提升批量业务的配置效率和准确性。

智能监控诊断

管控系统通过数据采集、分析、策略、控制,可实现端到端运维闭环,通过带内性能诊断功能,结合Telemetry的网络监测技术,能够及时充分收集网络内的大数据,为网络智能监控与优化提供保证。在运维过程中,通过智能的故障定位和告警根因分析,帮助运维人员快速定位故障点,大幅提升故障定位效率和降低定位难度。

-Telemetry技术
基于Telemetry的网络监测技术可提升网络智慧化能力,通过结合人工智能(AI)算力来实现网络的精细化检测和可视化管理,未来有望实现承载网络的智慧化运营。Telemetry高效网络监测采集技术,能够充分收集网络内的大数据,是实现未来网络智慧化运营的基础。与传统的简单网络管理协议SNMP和SYSLOG等网络监测采集技术相比,Telemetry数据采集周期更短,推送的数据范围更广,不但包括告警及事件,还可以采集类似接口流量等的监控数据,Telemetry对网络监测控制效率的提升有着至关重要的作用。

-带内性能诊断
传统的带外测试方法,如基于隧道的OAM和TWAMP,需要管控侧显式配置测量任务,需要手工维护测量任务,测量任务与业务实际情况还可能有偏差,故障定位需要逐段实现。通过带内测量,可以有效解决上述不足。管控系统基于真实业务流进行带内性能检测,提供实时、高精度的网络端到端性能可视化和逐跳故障定界能力,提升性能劣化类故障的定界、定位效率。带内性能检测具有测量任务维护量小、业务质量指标真实、故障定位迅速的特点;可实现带内业务流自动识别,根据基站IP地址、EPC/NGC IP地址,自动识别端到端路径和业务质量。带内性能数据使用Telemetry协议可快速上报到OMC系统,为智能运维提供数据分析基础。

-故障根因分析
引入AI技术对海量告警进行智能分析,挖掘告警关联的规则,包括同一对象告警关联、同一端到端路径告警关联、跨层业务告警关联规则等,准确识别根因告警,有效缩短故障定位时间,减轻系统的告警数据处理压力,可大幅提升故障定位效率。

-故障智能辅助定位
通过测试套件功能进行网络诊断,实现快速故障定界。基站业务全路径上的告警过滤浏览功能,帮助运维人员快速查找该基站所经过网元的告警。告警影响业务范围浏览功能,能够帮助运维人员快速查找关联的受损业务。现网业务出现故障,通常原因是误配置。系统提供端口、隧道、业务和路由配置一致性检查功能,对配置数据进行自动排查,减少人为配置错误,提升维护效率。

-故障回溯
管控系统提供历史故障回溯功能,并通过分析网络业务路径的SR-TP隧道性能KPI,如时延、丢包等指标,快速定位故障。系统通过查看路径质量劣化告警,对产生告警的路径触发历史故障回溯和诊断。根据时间轴回溯历史路径、故障和性能(时延、丢包)。通过故障链路、端口性能劣化的关联分析,查看逐跳路径详细信息,以及端口流量、光功率性能、队列丢包、端口误码等信息。

智能分析优化

基于AI、大数据等技术,通过流量预测和故障模拟分析功能,提前发现网络瓶颈,提高网络的健壮性,降低网络运营风险,有效提升网络抗风险能力。

-流量预测

管控系统基于历史流量数据,通过大数据分析算法进行流量预测,即能根据现网已有的历史流量数据,结合机器学习等人工智能算法,快速全面预测全网流量趋势,预警即将饱和的业务,精准定位网络资源(端口、链路、环网)瓶颈,以指导现网提前进行调整或扩容,并帮助运营商提前进行大客户流量营销。图形化呈现历史流量数据和周期性流量趋势预测结果,可以图形化形式直观展示端口、链路、环网等网络资源的瓶颈。

-网络故障模拟仿真

管控系统通过模拟网络故障后流量分布,发现网络瓶颈点,可针对网络提出扩容建议。用户可按需设置多个网元和链路的故障点,进行业务隧道故障仿真分析。故障仿真分析结束后,查看仿真统计信息,包括仿真时间、仿真链路及其承载的隧道、链路带宽利用率等信息,提示故障点对应影响的链路等网络瓶颈信息及影响的业务隧道。

中兴SDN智能管控系统采用AI和大数据技术,为客户的网络提供全生命周期的自动化和智能化运维。结合5G SPN网络的运维场景和特点,通过智能化的运维手段,提高运维效率50%以上,降低OPEX 28%以上。

中兴通讯积极探索网络的智能运维,在2019中国人工智能峰会(CAIS)上,中兴通讯SDN智能管控系统凭借集中式SDN控制架构、基于深度学习的AI传送网资源分配算法优化等多项AI创新技术,荣获2019年度CAIS“紫金产品创新奖”。中兴通讯将继续推进网络智能化的研究,基于AI技术使智能管控系统进一步具备自主推理分析的能力,自主形成策略并执行和保障,向意图驱动的自治网络目标迈进。