数据中心网络自智研究

发布时间:2023-08-21 作者:中兴通讯 刘胜

        伴随AI、5G等新技术的不断发展,数据中心网络已成为数字经济基础设施的关键组成。网络管理也从静态配置扩展到动态调整,从单资源池管理到全域协同。网络规模不断扩大,网络的运维要求也随之而来。为了满足规模运营、故障快速定位以及网络性能优化等各方面的需求,自智网络应运而生。

        数据中心资源池自智运维架构如图1所示,资源池自智网络的五个核心组件是:意图管理模块、健康度监控模块、AI辅助分析模块、规划模块和数字孪生模块。这五个模块共同完成网络生命周期中规划、建设、维护、网优、运营不同阶段不同场景的全流程闭环自动化。

 

数字孪生模块

        数字孪生的主要特点是模型加数据。即利用大数据处理技术,对物理实体工作时产生的数据进行分析和处理,将其模型化、规范化。同时,数字孪生还可以完成仿真和预测,基于建立好的模型,将预制的数据作为输入,得到相关结果完成仿真和预测。

        数字孪生由镜像、仿真、预测三类功能组成:

        - 网络镜像提供历史和当前的镜像数据,形成孪生数据;

        - 网络仿真在孪生数据基础上,模拟网络操作,对网络的瓶颈进行仿真,输出仿真报告;

        - 预测模块基于孪生数据历史或预测未来,并输出结论供其他模块决策参考。

        镜像网络是实际通信网络的镜像,是实际通信网络在数字空间的等价映射,为仿真、分析、预测提供任意时刻的数据。

        数字孪生的关键技术包括:

 

        - 框架支撑技术:包括建模技术(数字孪生网络管理实体建模)、协同技术(多模型协同/数字线程);

        - 镜像网络:包括数据复制、数据还原、时序数据库;

 

        - 仿真:包括路由协议仿真技术、IP流推导技术、bottleNet structure graph技术、RouteNet/ XNet技术、光器件仿真技术;

        - 预测:包括知识图谱技术、图神经网络技术。

 

AI辅助分析模块

        AI辅助分析模块是在数字孪生的基础上,通过基于大数据训练的AI模型以及知识图谱的智能分析技术,完成网络参数调优以及故障的主动预防。首先,分析模块通过机器学习算法,快速发现网络中的异常特征,并将这些异常特征关联到具体的模型上。然后,借助仿真验证模型,不断构造实际网络/业务可能出现的各种问题,结合已有的故障处理方法和经验,不断迭代,实现网络中的故障快速定位。AI辅助分析模块建立了一整套故障发现、故障根因分析、故障影响推理、故障处理维护的统一框架。

 

健康度监控模块

        健康度监控模块基于数字孪生底座,实时监控整网设备、链路、资源使用情况。通过大数据技术构建海量设备数据的采集与分析能力,实时感知设备KPI、状态以及表项变化,图形化呈现告警信息及异常设备。网络发生故障时,可快速定界到故障设备,及时完成业务保护切换。对于关键器件(光模块)的主要参数进行趋势监控,当发现器件性能趋于劣化时,可提前预警,避免业务受损。

 

意图管理模块

        意图管理模块对应的是用户的意图,或者可以理解为运维人员、架构师的意图。用户将自身诉求传达给系统,通过转译和验证,确认无误后执行。

        意图管理模块由4个步骤形成闭环运作,即:意图表达/收集、转译,意图翻译结果检查,自动化执行、自动调优,网络状态感知上报,最终完成意图闭环。

        SDN和意图网络都是“自顶向下”构建网络的系统设计思路,但从本质来看,SDN偏好技术型用户,而意图网络提出理念就是面向最终用户的,它更多瞄准的是用户意图或商业目标,强调网络运维和架构人员的意图。

 

 

 

网络规划模块

 

 

        网络规划模块是在网络规划阶段,基于用户意图以及图形化的设计工具,完成网络规划建议、网络规划设计以及网络仿真验证等工作。同时,基于规划的功能,自动生成所有设备的配置文件。在后续的建设验收阶段,系统可以使用自动化部署工具完成网络设备的自动上线并完成实际拓扑和设计拓扑的对比,自动完成网络验收。

 

        网络自动化将大幅提升运营商的效率并使能全新的数字化业务,同时通过使能新业务,改变社会与千行百业。目前,自智网络正处于从理念到实现的关键阶段,很多应用都处于初始阶段,呈点状发展。自智网络已不再是一个可选项,而是网络发展的必由之路。