AI智能降耗探讨和实践

发布时间:2024-06-24 作者:中兴通讯 武利明 阅读量:

        5G时代网络在传输速率、传输时延、连接规模等关键性能指标上有了质的飞跃,从而可以支撑更加丰富的业务场景和应用,但也给运营商带来了CAPEX和OPEX不断攀升的挑战,对网络能效提出更高要求。国际电信联盟无线电通信组公布的IMT-2020愿景文件中,“网络能源效率”一词首次被纳入5G的KPI。中兴通讯承载产品通过引入AI人工智能,能够高效准确地采集数据产品和能效相关的不同维度的全部数据,通过算法的训练学习,精确拟合设备运行状态,识别流量变化,提升设备的节能效果,大幅减少电力消耗和能源浪费。

 

AI智能降耗研究

 

        承载网设备功耗总体分为两大类,静态功耗和动态功耗。

        静态功耗的主体是网元设备的各种硬件单元和芯片,静态功耗在设备开启上电后就一直存在,即使没有流量也有固定的功耗,不随负荷而变化,可以采用先进的低功耗芯片架构、高效的散热设计等降低静态功耗。

        承载网设备的动态功耗与业务流量负荷强相关,在设备运行过程中,流量负荷越低,运行功耗越低。中兴通讯承载产品已实现基于AI的动态降功耗技术,关键就是以流量为核心,通过AI人工智能技术,对已有流量历史数据进行训练和学习,识别不同设备的流量变化趋势和所处的业务场景,对负荷较低的网络设备关断相关冗余硬件单元,实现动态功耗的降低。

        硬件关断动作就是关闭部分空闲的硬件资源,从而达到降功耗的作用。对于网元设备,可以关闭线卡空闲的物理端口、Serdes总线、线卡以及交换板。目前在实际部署中主要是关闭交换板,交换板的数量和流量负荷具有线性关系,动态关断交换板具有明显的降功耗效果以及较高的安全性。

 

AI智能降耗的实现

 

        中兴通讯已经在数据产品上部署了AI智能降耗功能,基于时间序列算法实现流量的长短期变化趋势预测以及流量场景分类,通过动态关断和休眠硬件器件实现智能降耗,整体节能效果相对于传统静态节能效果更优。

 

节能算法策略

        AI智能降功耗通过关断空闲的硬件器件来实现降功耗的目的,因此在实际部署中,需要在降功耗的效果与硬件动作的安全性间取得平衡,主要有如下原则:

        - 不同流量场景采用不同节能策略,具有一定的流量突变的容错空间;

        - 全面的异常检测与识别机制,快速响应异常事件,及时退出节能,保证业务安全;

        - 尽量减低硬件动作的频次,降低硬件频繁关断带来的故障风险。

        AI智能降功耗的核心是流量预测,通过对网元设备长短期流量趋势的分析与预测,可以识别出各种流量场景,针对不同的流量场景的特性,判断是否满足节能准入条件。对于长期相对稳定、周期性特征比较明显的流量场景执行动态节能,对于流量随机波动以及突发较大的流量场景,则相对保守,不执行节能策略。

        为了提升AI算法的准确性,并对风险进行评估,实际部署中综合使用多种时序算法进行预测,通过调整不同算法的权重让预测趋势更加准确,以此应对流量场景的变化。

        在实际部署中,对硬件的上下电动作进行监控,当检测线卡或者交换板异常上下电后,需要选择是否退出节能状态。

 

网元与网络级节能  

        网元级的流量预测无法感知网络整体流量变化趋势,当发生网络级的流量变化时,网元无法快速响应,因此AI智能降耗需要网络与网元协同实现流量趋势预测。当前已部署的方案通过网元设备、管控以及云端协同实现AI智能节能闭环系统。管控基于网络全局拓扑资源(包含设备间的拓扑连接关系、业务路径等)计算不同网元的保护预测带宽,并下发到网元实现网络级的流量预测;网元结合本地的流量预测结果进行融合,决策最终关闭的交换板数量。

        对于没有部署SDN管控的场景,在网元内实现内嵌的网络级流量预测功能,定义了如下两类带宽类型:

        - 网元内保护带宽:考虑网元内部端口故障、线卡故障等导致流量迁移,单板可能的最大带宽,图1展示了网元内单板故障时的流量迁移情况;

        - 网元间保护带宽:考虑其他网元故障导致流量在网元间转移,单板可能的最大带宽。

        算法基于的原则是,任意时刻对于一个网元,输入的流量总和等于输出的流量总和,计算所有线卡的长周期流量最大值,包括入向流量最大值以及出向流量最大值,计算线卡流量转移矩阵,即所有线卡两两之间的最大带宽(入向和出向比较),取所有线卡组合最大值作为线卡的保护预测带宽。

        总体上这种算法预测值会偏大,线卡数量越少,这种算法预测得越准确。

 

 

 

        中兴通讯IPRAN路由器已经进行了联通智能城域网试点测试,对于路由器7+1交换架构,在流量低负荷情况下,最多可以关闭6块冗余交换板,最大可以降功耗23%左右。流量负荷波动比较大的情况下,节能整体效果在15%~20%区间;对于路由器3+1交换板架构,最多可关闭2块交换板,节能整体效果在10%~15%之间。

        此外,AI智能降功耗也已经基于SPN 67产品在中国移动得到了大规模的试点商用,整体节能效果15%左右,取得了良好的经济效益。