随着5G SPN承载网从1.0向2.0跃升,承载设备相应地提供了小颗粒、Inband OAM端到端随流实时检测、灵活连接和智能化能力。中兴通讯管控系统基于上述网元设备能力,整合网络资源,创新推出多项简化运维的智能化工具。
中兴通讯网络智能化架构分为两部分(见图1):NE(Net Element)智能部分为网元内生智能,是在网元内完成的智能化能力,并可向管控系统提供数据;单域智能部分为管控智能化部分,是在管控系统中完成智能化能力。
图1 中兴通讯网络智能化架构
网元内生智能
网元内生智能,通过网元动态数据的实时监测分析,对软硬件资源进行最优匹配和精细化运维,实现对网元内部组件的智能控制;同时,为上层管控系统提供精细的性能、状态、质量数据,并提供灵活调度能力,支撑自智网络实现自治。
网元内生智能包括高精度数据感知、网元故障精准定位和动态能耗控制几个方向。
- 高精度数据感知:传统设备信息采集采用15分钟告警和性能上报,颗粒度粗、控制器获得的故障信息分辨率低。为了实现高可靠的数字孪生系统,网元设备数据感知能力需要大幅提升,向秒级、毫秒级的更高精度目标迈进。同时,当上报数据海量增长时,对设备的信息上报能力也提出了更高要求,需要提供更可靠的上报模式,以及更高效的数据缩方法。SPN2.0时代,设备内感知全面达到秒级,关键应用达到毫秒级感知能力。
- 网元故障精准定位:与面向网络的控制器故障诊断不同,设备内的故障诊断通常关注单板的应用状态和软件跨组件的程序执行逻辑是否正常。SPN2.0基于设备日志、告警、性能等实时信息建立网元运行模型,通过云端训练、本地推理,捕捉软件程序执行异常和单板性能异常细节。这种设备精细分析方法,和网络控制器的故障分析相结合,形成对通信故障的全方位感知,也为网元自愈技术的发展提供可达路径。
- 动态能耗控制:中兴通讯SPN设备除了在设备硬件设计里广泛采纳更先进的架构、更高集成度的芯片、更新的制作工艺和更高效的电源外,同时还在设备软件里采用回归算法,通过分析通信网络流量的潮汐效应,对耗能器件动态调整休眠与唤醒,实现随环境变化的动态能耗控制。
管控智能化
管控智能化重点包括网络仿真应用、业务意图开通、智能故障诊断等核心能力。
网络仿真应用
数字孪生仿真系统通过同步现网设备配置、网络拓扑以及流量信息,解析还原整网拓扑和协议,构建无限贴近现网流量和业务的仿真网络。基于此系统,通过What-if仿真分析、网络容量规划、网络健壮性分析、网络变更验证等功能,可以大幅提升SPN网络规划自动化水平,满足SPN网络未来长期演进需求。
- What-if仿真分析:What-if仿真分析是一种假设分析的评估方法。基于数字孪生仿真系统,通过分析可能的网络变化(如SPN网元/链路故障、流量变化等)对业务的影响,支撑运维人员更清晰地了解影响范围;同时模拟采取不同策略方案产生的不同结果,分析制定最佳的应对方案,从而提升SPN网络可靠性。
- 网络健壮性分析:网络健壮性分析能力,基于现网过往大量的实际故障场景,分析工作网络中关键元素(如网元、链路)故障场景下业务所受的影响,并对所有故障场景下的业务影响程度进行排名,识别最差场景以及造成最差场景的故障根源,再根据分析结果,对网络薄弱环节进行针对性优化整改,提升SPN网络整体健壮性。
- 网络变更验证:数字孪生仿真系统的网络变更验证功能,可以对业务割接进行事前仿真模拟,识别每一步操作对现网业务的影响,实现现网1:1验证,避免专家评审、实验室验证等传统验证手段带来的资源耗费较大、变更风险难以完全排除等问题,确保每一项割接任务都能低成本、低风险完成。
基于意图的业务自动创建
基于意图的业务自动创建功能,使得用户只需要关心客户业务需求是否得到满足,而不用掌握专业网络知识;业务开通时间由原来的十几分钟缩减至分钟级,业务创建成功后,用户对业务的诉求得到持续的保证。
业务智能创建方案分为以下5个部分:
- 意图识别:通过提取用户输入的关键信息,识别业务场景及其指标要求,比如基站承载业务、专线业务、家庭宽带业务、垂直行业业务等;
- 生成方案:根据业务场景,选取合适的AI模型自动生成多种满足业务场景的网络配置方案;
- 意图验证:用户选择合适的方案并调整部分参数后,系统将该配置方案在数字孪生仿真系统中模拟下发并进行评估验证;
- 开通实现:经过验证的配置方案自动下发到各相关站点完成业务开通;
- 意图保障:业务开通后系统持续对业务进行管理监测,当网络状态无法满足用户意图或用户意图发生改变后,自动对相应的设备或网络资源进行调整,持续保障用户意图。
智能故障诊断应用
通过智能故障诊断应用功能,平均修复时间、平均响应时间大幅减少,告警压减率大幅提升,满足用户高效运维诉求。
智能诊断工具主要包含以下4个部分:
- 远程采集、大数据分析:远程采集获取全网异常数据,进行大数据分析,提升故障数据分析效率、分析深度及分析全面性;
- 训练并形成故障模型库:支持离线训练和在线训练,对网络中典型、常见的故障训练形成故障模型,对故障场景经验固化,并持续进行知识积累和学习;
- 对故障多维度分析和追踪、快速定位故障根因:快速识别故障根因、展示告警传递和衍生的时空关系,对故障进行时间追踪,提供相似故障经验推荐,帮助运维人员快速处理故障;
- 提供多维度解决方案推荐:根据故障情况,推荐多个解决方案;解决方案根据故障处理经验,可维护、可持续积累。
SPN承载网络为智能化实现提供了基础,智能化的推进反向促进网络能力的提升。遵循CCSA对智能化的能力分级,SPN网络智能化演进将从网络运维的六大场景(规划设计、部署开通、业务发放、监测排障、网络变更、网络优化)推进,达到三“零”(零等待、零故障、零接触)三“自”(自配置、自修复、自优化),最终实现网络自治目标。