随着6G、算力网络、云网融合等新型网络技术不断迭代,云化核心网演进逐步深入,伴随而来的网络运维运营挑战极速增长。智能化算法、平台均处于快速演进阶段,但发展尚不成熟,而核心网是通信网络的基础底座,对于可靠性要求极高,如何优化新技术演进给网络带来的影响,最终实现网络自智的终极目标,需要缜密规划。
业界主要进展及方案
随着TMF、CCSA等标准组织启动标准或研究立项,各大运营商针对网络支撑系统及网元智能化进一步完善,提出了自智网络“三零三自”“四零四自”“智行云网”愿景以及“四层三闭环”等目标架构,在“规、建、维、优、营”等运维场景中,为网络智能运维指明了方向。到2025年,业界目标建立L4自智网络,网络持续演进,针对各大类运维场景逐步提升相应的智能化能力,能够通过AI能力实现规则的持续学习、持续迭代,建立基于图谱的智能运维知识体系,根据特定的规则,匹配相应的策略,使得业务意图与网络资源有机结合,形成自底向上的智慧能力大模型。
中兴通讯云核心网内生智能解决方案
参考业界分层自治架构,中兴通讯提出内生聚能,构建云核心网NFV域内自治闭环能力。整体分为基础设施层、网元层、管理层内生智能,分层自治,跨层联动,实现核心网单域自治(见图1)。通过能力开放,与跨域系统紧密协同,实现端到端网络智能分析与闭环保障。
网络规划建设阶段,实现“零等待”。方案基于中兴通讯自动化工具集AIC(Auto Integration Center),采用自动化CI/CD(持续集成/持续部署)工具链,实现从版本发布到版本安装、运行的分钟级开通能力,通过网元部署“自配置”,实现业务配置自动生成、自动开通,边缘设备即插即用,业务参数自动获取、自动下发,整体核心网网元业务开通时长小于30min。
针对网络运维,基于中兴通讯管理域智能化系统CNIA(Core Network Intelligent Analysis),方案支撑核心网内生智能,形成智能监控、诊断、决策、执行四大核心能力,通过闭环控制,支撑网络自愈、自优化及作业自动化,实现由被动应急运维向主动高效运维的转变。
- “零故障”:通过AI算法,对故障隐患进行有效识别,采用“自修复”的方式实现网元设备故障快速定界定位,处理方案自动决策执行,业务问题自动修复;
- 隐患识别:通过可编排能力将多种运维数据(资源、告警、日志、KPI、投诉等)汇聚识别和诊断,在5min内完成故障的隐患识别分析;
- 故障诊断:通过持续不断的规则迭代学习,在15min内完成故障定界定位,告知运维人员故障根因,并提供处理建议,同时形成专家经验累积模板;
- 业务预测:通过AI算法,实现动态阈值模型,能够早于固定阈值识别业务异常,从被动监测型运维向主动预测型运维转型;
- 故障恢复:采用智能容灾倒换、智能流控、预警逃生等机制,当预测故障即将发生前,能够实现业务自动迁移,达到业务“零”中断,保证业务正常运营,用户体验不受影响。
业务保障方面,采用NWDAF(网络数据分析功能)等优化手段,智能动态感知业务质量及用户体验状态,识别业务质差,形成保障策略,并下发网络自动生效,持续提升客户感知。
网络运营方面,实现“零接触”“自优化”和自动业务保障。
- “零接触”采用意图驱动的模式,自动生成运营策略下发网元侧执行;通过业务特性预测及分析,找到辅助业务性能“自优化”的方案,提升业务质量,优化用户体验。
- 业务识别:采用AI算法,基于业务特征数据智能学习,不断提升对加密业务的识别率,目标实现对95%以上的业务可识别。
- 业务保障:实现对用户业务重点体验指标的保障,如在云游戏场景下,时延小于30ms,带宽大于10Mbps持续下发。
中兴通讯已在浙江移动、泰国AIS等项目中部署智能化运维管控系统,辅助运维效率提升、网络质量优化。
当前AI技术整体还不够成熟,技术更新快,为了降低新技术对通信基础设施的影响,在向L4演进中,需要结合意图驱动、数字孪生等技术,初期通过建设TestBed等方式,对AI技术进行充分验证,成熟一批商用一批,最终实现基于数字孪生虚实一体的网络目标。AI平台的构建呈现多元化趋势,为解决AI平台建设的“烟囱”问题,建议产业内对于AI能力形成统一的度量标准、评价规则,建立良好的AI生态环境,使得AI能力得到充分的共享、提升,应用能够快速集成、调用,以推动整体网络运维能力的快速提升。