IP自智网络架构和关键技术

发布时间:2024-06-24 作者:中兴通讯 王承锋,王怀滨

        2019年,TM Forum提出“Autonomous Networks”(自智网络)理念,旨在引领网络基础设施和运营体系的自动化、智能化转型,帮助运营商简化业务部署,推动网络具备自配置、自优化、自治愈和自演进能力。各大产业和标准组织纷纷启动自智网络相关标准或研究立项,国内CCSA相关标准工作也在加速。到2023年,已有89家参与者及AN组织参与自智网络推进。91%的运营商将网络自动化、智能化纳入战略规划;预计未来3—5年,网络自动化、智能化相关TCO投资占比将从15%提升至22.7%。

        IP自智网络的目标是致力于帮助IP网络运营商简化IP业务部署,实现的重要标志是“Zero-X”和“Self-X”:

        - Zero-X:最终用户获得“零等待、零接触、零故障”的服务体验;

        - Self-X:经营者的网络具备“自服务、自发放、自保障”的能力。

   

IP自智网络架构概述

 

        中兴通讯IP网络智能化体系如图1所示,自下而上,分别为网络层、管控系统、上层系统。IP网络层需要建设网元内生的智能化能力,即在设备内部提供网元的可感知、自配置、自恢复、自优化的内生实时智能化。中间层是管控系统,对于每一个管控域需要建设域内闭环的智能化体系。中兴通讯智能化管控系统ZENIC ONE提供云原生平台,采用感知引擎、控制引擎、意图引擎三大引擎,结合最新的AI技术平台、大数据技术平台,形成可持续学习的闭环系统。同时,管控系统ZENIC ONE为上层系统提供智能开放的API接口,支持跨域的全局协同和基于网络应用的生态闭环。

        中兴通讯对于网络内生智能的理解是通过对IP网元动态数据实时监测分析,实现软、硬件资源最优匹配和精细运维,实现智能控制。同时,为上层系统提供精细的性能、状态、质量数据,提供灵活的可调度能力。

可感知

        IP网络需要支持实时可感知的特性。网元能够实时监测自身软硬件以及承载业务的运行状态、工作负载、异常告警等,为本地闭环决策或网络级闭环决策提供数据支撑。

        针对网元的可感知能力,中兴通讯主要作了三个方面的提升:

        - 从网络检测的带外方式向带内检测升级,实现IP流的可视化和可度量。IP随流检测可以更加准确地测试IP网络的业务质量,并减少网络中的检测报文。IP随流检测有效提升了网络感知的准确度和效率。

        - 网络感知粒度的不断精细化。感知粒度从30秒采集过渡到10秒采集粒度,然后再提升到1秒采集粒度。

        - 网络感知智能化。在追求网络感知精度的同时,也需要考虑网络数据处理的效率问题。中兴通讯在精细化感知场景中,引入AI技术,实现感知粒度的自学习和自适应。这种技术能够大大压少网络采集的数据量,在整体提升效率的基础上也能保证感知到网络状态的微小变化。

 

自配置

        针对IP网络的自动部署能力,中兴通讯从以下3个方面进行提升:

        - 网元能力开放,支持NETCONF、PCEP、BGP SR Policy、BGP-FS等接口协议。

        - 网元支持配置回滚,提升网元自动部署的容错能力。对于配置下发过程中的失败场景,能够自动回滚;对于已经生效的配置,也能通过设置回滚点,进行配置回滚。

        - 网元支持VPN和隧道组合配置,支持业务自动化部署和自动优化。

 

自恢复

        IP网络自恢复,主要是故障智能诊断与恢复,中兴通讯作了如下提升:

        - 关键部件冗余保护,毫秒级硬件故障切换。

        - BFD链路故障快速检测。支持链路故障的快速检测,为业务的主备倒换提供50ms检测机制,网元能够快速进行业务倒换,自动恢复业务。

        - TI-LFA FRR流量快速切换。网元能够进行快速流量切换,自动恢复业务流量。

        - 支持配置业务的逃生路径。在端到端业务路径失效时,能够快速进行保护倒换,将端到端业务逃生到保护路径,快速恢复业务。

 

自优化

        IP网络自优化从以人工配置为主的优化向智能化主动调优演进。中兴通讯作了如下提升:

        - 设备功耗自动调整。支持按照学习的流量潮汐规则,自动调整端口和单板的使用数量,从而调测设备功耗。

        - 风扇自动调速。可以根据网元单板和机架的温度监控,自主判断和决策。

        - 组件负载动态休眠。在设备组件负载低时,系统自动进行判断和决策,将相关组件进行自动休眠,以达到节能目的。

 

IP自智网络关键技术

 

        中兴通讯从长期的自智网络实践中,总结出IP自智网络的关键技术:意图网络、智能感知、数字孪生、数字地图、智能决策、AI和大模型。

 

意图网络

        基于意图的网络是一种在掌握自身“全息状态”的条件下,基于人类业务意图,借助人工智能技术进行搭建和操作的闭环网络架构。意图网络包括以下4个模块:

        - 意图翻译和验证:系统从最终用户获取更高级别的业务策略,并将其转换为必要的网络配置,生成并通过仿真验证最终的设计和配置以保证正确性。

        - 自动化配置:系统可以在现有网络基础设施上配置适当的网络变更,配置操作可以通过网络自动化或网络编排完成。

        - 网络状态感知:系统对网络基础设施进行协议、传输透明的实时网络状态采集。

        - 意图维持:系统持续验证原始业务意图得到实现,并且可以在所需意图无法满足时采取纠正措施。

        意图网络技术覆盖意图的全生命周期的闭环,包括意图创建(业务开通)、意图维持(包括意图感知、分析、恢复和优化)。意图管理从意图创建开始,用户通过人机界面输入用户意图信息,经过意图解析、业务方案选择和仿真、业务下发和确认,使用户意图在网络上实际应用;然后进行意图维持。意图维持包括3层闭环。

        - 秒级业务自愈:系统根据业务质量,自动触发业务对应层网络对象的倒换或重路由,实现秒级业务自愈;

        - 分钟级业务恢复:系统在业务不能自愈时,进行业务质量的定位分析,选择对应的恢复策略,自动执行恢复命令,实现分钟级业务恢复;

        - 中长期业务优化:系统根据业务质量的变化情况,进行质量和流量预测分析,并选择对应的优化策略,自动执行优化命令,实现中长期业务优化。   

 

智能感知

        网络感知的全面性、精确性是运营自动化、智能化的基础。自智网络不仅需要感知全面和高精度的网络信息,还需要感知外部环境、业务状态和用户体验,以解决网络运营过程中“看不清、看不全、控不准”的问题。

        中兴通讯智能感知技术通过对网络环境和流量进行实时监测和分析,实现对网络状态的智能感知。通过智能感知,网络可以及时发现和应对网络故障、攻击和异常情况,提高网络的安全性和可靠性。

 

数字孪生

        网络数字孪生是以数字化方式创建物理网络实体的虚拟孪生体,且可与物理网络实体之间实时交互映射的网络系统,具有以下4个核心能力:

        - 数据:构建统一的数据共享仓库作为数字孪生网络的单一事实源,高效存储物理网络的配置、拓扑、状态、日志、用户业务等历史和实时数据,为网络孪生体提供数据支撑。

        - 模型:提供多种计算模型,例如流转发模型、光物理损耗模型。多种模型可灵活组合,仿真、分析和诊断各种网络行为。

        - 映射:基于孪生生数据,使用计算模型,将物理网络的状态映射到数字网络孪生体,例如网络流量分布及质量劣化情况。

        - 交互:网络孪生体采集物理网络的实时信息,并将孪生体的配置变更同步到物理网络。

        数字孪生由三类功能组成:网络可视化、镜像和预测、仿真。网络可视化提供拓扑透视和流量全息;网络镜像提供历史和当前的镜像数据,形成孪生数据,预测模块基于孪生数据预测未来;网络仿真在孪生数据基础上模拟网络操作,对网络的瓶颈进行仿真,输出仿真报告。

 

数字地图

        数字地图是基于数字孪生的网络可视化功能,能够提供拓扑、协议、业务的当前展示、历史回溯和预测。管控分析管理对象的当前、历史及预测的情况,根据客户选择的时间段,对管理对象的当前、历史及预测的状态输出分析报告。

        数字地图的特点:

        - 支持全网一张图全息展示,可与GIS结合做全网拓扑的缩放;

        - 统一的资源建模和管理,提供万能搜索能力,支持搜索网络内的各种资源;

        - “多层资源”网络模型,从物理层、光层、链路层、协议层、业务层、应用层组织和展示网络资源模型;可独立展示,也可以叠加展示;

        - 多维数据,将网络场景的状态、流量、时延等数据叠加到网络资源对象,灵活组织叠加数据;

        - 多重时刻,除了展示当前网络数据,还支持历史回溯、趋势预测的数据,实现网络历程的可视化;

        - 多种状态,规划态、孪生态等不同状态的网络资源对象可以与网络应用功能结合,按需进行状态迁移;

        - 应用交互,可作为网络应用功能(包括网络规建维优各场景)的交互入口,作为网络可视化的数字底座。

 

智能决策

        智能决策技术能够根据智能感知的结果,自主进行网络资源调度和优化决策。通过智能决策,网络可以实现自动化的网络管理和优化,减少人工干预,提高网络的运行效率和性能。

        智能决策技术的关键技术包括智能调度算法、资源优化策略、自动化决策系统等。智能决策技术广泛应用于网络资源调度、负载均衡、容灾备份等场景,能够提高网络的资源利用率和运行效率,保障网络的稳定运行和业务连续性。

 

AI大模型

        高阶自智的跃迁需要高阶技术的突破和引入,AI大模型被认为是实现自智网络L5的新引擎。基于AI大模型的智能学习技术能够通过机器学习和人工智能算法,对网络行为和性能进行学习和优化。通过AI大模型的智能学习,网络可以不断改进自身的运行机制,适应不断变化的网络环境和需求,提高网络的自适应性和智能化水平,从而提升自智网络等级到高阶自治。

        业界对于AI大模型在自智网络的应用规划如下:

        - 2023下半年—2024年:以自然语言交互式的运维场景开启试点,大模型应用形成范式;

        - 2025年:大模型应用仍以运维辅助为主,实现基于大模型的网络作业生成;

        - 2026以后:业务模式从X+AI逐步转换到AI+X自智架构,向自智网络L4+演进。

 

        中兴通讯长期致力于网络智能化的探索,把握技术主流趋势,通过创新方案解决传统网络方案的各种挑战。中兴通讯通过践行自智网络理念,结合最新的技术方案,不断提升网络运维效率、资源利用率,助力IP网络智能升级和可持续健康发展。