服务感知网络技术和演进探讨

发布时间:2024-06-24 作者:中兴通讯 付华楷,黄光平

        后5G时代,云原生和分布式算力成为新形态,业务开始跟位置和资源解耦。同时,丰富的网络能力需要简明高效的开放接口,以支撑不断涌现的新型业务。针对这种新形态和新需求,业界需要从IP基础网络的视角,进行统一的架构设计,以整合算网架构和资源,节省部署成本,助力业务快速上线。

        中兴通讯提出智能云网解决方案CLOUD IP, 致力于构建新型信息基础设施,旨在无缝整合算力和网络资源,形成一体化供应、运营和服务。服务感知网络(service awareness network,SAN)作为CLOUD IP的核心组件,专注于云网和算网融合,其核心在于深入理解业务需求并提供精细化SLA保障。部署策略上,SAN强调对网络和算力资源的全局智能感知和调度,支持解耦和混合部署,为云网融合和算力网络的整体框架设计提供优异的解决方案。

 

服务感知网络系统架构和关键技术

 

        在当前的IP分组网络环境中支持算力路由面临诸多关键挑战:

        - 服务路由与IP路由差异:作为多实例寻址的新方法,服务路由与传统的IP主机和网段路由不同,它通过根据SLA需求动态调整节点选择和流量分配,利用服务标识连接不同资源实例,实现灵活的动态映射。

        - 算力感知扩展的影响:为了接纳广泛的分布式算力,网络需要扩展接口和协议,但过多的算力细节可能对网络控制面的稳定性和转发性能产生负面影响。

        - 算网一体化计算复杂性:引入多种优化因素增加了计算复杂性,这给现有网络性能带来了压力,亟需创新解决方案以解决这些问题。

        - 算网SLA的一致性:由于网络和云侧的OAM机制分离,导致无法实现端到端的性能评估,阻碍了对算网调度效果的全面评估,从而影响预先设定的SLA目标的达成。

        针对这些挑战,服务感知网络采用基于服务标识的算网一体架构(见图1),将服务标识引入算网融合与路由系统,构建了面向业务和计算的IP分组网络新接口。这个接口通过服务标识驱动,数据层面细化寻址与流量管理,控制层面关联动态分配的算力资源与业务SLA,形成了基于IP分组网络的服务感知子层(overlay)。

        传统分组数据网作为底层连接,为服务子层提供连接保障。服务子层与基础架构的交互依赖于服务标识的控制面索引,以实现终端用户与服务提供商的端到端高效交互。为了兼容现有设备并处理数据传输,SAN在网络边界引入了服务感知网关。

        SAN的关键技术创新体现在以下几个方面:采用了以服务标识为核心的算网融合架构,这一创新突破了传统方法的框架,为IP分组网络引入了新的服务导向理念和动态管理模式;与现有方案相比,SAN架构在服务感知、算力管理和SLA一致性上展现出显著优势,它能够更精确地满足多实例需求,同时保持网络控制面的稳定性及优化转发性能;通过新颖的路由计算技术,提高了计算效率,减小了对网络原有性能的冲击,而且在保持兼容性的同时,实现了更快的算网调度和SLA达成速度。这些创新特性,使SAN不仅填补了空白,更在性能和效率上超越了行业标准,将为用户带来更加的优异的算力访问体验。

 

 

关键技术1:全局独立语义服务标识治理

        服务标识在用户、业务、算力和网络系统中扮演接口角色,对资源提供者和运营商来说,它是算网能力的承诺接口。为确保服务标识闭环可控,算网运营方需管理其全生命周期,包括注册、发布、订阅、更新和终止,这些操作都在运营系统的统一治理流程中进行。在不同算网管理区域间,服务标识的互操作需要经过协商、映射,甚至标准化,这取决于具体的部署和运营模式。基础服务通常会寻求跨域的标准化,而大部分服务标识治理则局限于单一管理域,无需强制统一标准。

 

关键技术2:多量纲算力度量和层次化算力路由

        为了实时感知网络对算力资源的需求,需要扩展接口和协议,同时整合新的路由表条目。不过,全面展示动态且多样化的算力资源可能会降低网络效率,这会增加路由表的负担,影响节点性能。SAN采用分层策略:仅边缘节点保留与云服务实例相关的路由信息,减轻远程节点的处理压力。边缘节点负责维护动态路由表,快速变化的服务实例状态则维护在本地,通过两次路由转发避免对IP网络表项造成冲击。

 

关键技术3:基于SDN的算网TE计算架构

        基于IP网络的算力路由本质上是从一维升级到二维路由,理论上将导致乘数效应。SAN采用SDN的控制分离和可编程优势,通过扩展BGP协议,融入算力信息,并结合传统TE(traffic engineering)技术,实现基于IP网络的算力路由。

        BGP扩展提供了算力感知能力,而TE计算与下发流程基于TE-DB和CA-DB,以满足定制化的算网SLA需求,计算出最优路径和实例。SAN-TE设计允许灵活部署,兼顾集中全局优化(跨越多个区域、连结算力与网络)与快速收敛的分布式计算。算网TE的约束分为体验(如延迟、抖动和丢包)、成本(资源消耗和能耗)和效率(如资源利用率、均衡性)三类。

 

关键技术4:基于服务标识的寻址和转发

        SAN利用服务标识映射网络和算力需求,如时延、带宽、抖动、丢包等关键性能,以及能耗和成本。服务感知网关通过简化标识在报文中的传递,为业务应用提供了差异化的集成服务,减少资源消耗,减轻数据处理压力,节省网络资源。

        SAN提供两种封装服务标识的方法:一是无主机变更的Anycast IP,支持算网一体化;二是IP扩展头,支持算网一体化或差异化连接服务。整体来说,SAN通过智能化管理和灵活的标识策略,优化了服务交付和资源利用。

 

关键技术5:算网OAM

        传统电信级网络OAM技术与IT系统可观测性技术自成体系,无法兼容拉通。为实现算网融合中端到端的无缝监测,需要打通网络域和云域的端到端OAM能力。SAN引入了融合算网OAM方法,专注于监测和优化从算力网关到计算实例的性能,支持高效路由收敛和业务质量保障,具备高度实施性和扩展性。SAN构建了一个基于算网OAM的闭环系统,包括慢速控制面的数据采集与分析,生成业务转发策略,并通过规则驱动基础操作。快速OAM实时调整,形成动态负反馈,确保一致的算网服务质量。

 

服务感知网络演进和思考

 

        服务感知网络的技术演进路线整体上可以分为两个阶段、四个步骤(见图2):

        - 提供智能连接服务:通过SAN服务标识映射网络需求,实现应用感知网络;充分利用SRv6技术优势,实现云网融合下的精细化连接服务管理和保障。

        - 优化算网一体化服务:针对边缘计算等场景及低延迟需求,提供无侵入的端侧调度解决方案,实现实时算网一体部署。

        - 深化算网一体化服务:基于算网一体调度技术,创新端侧协议栈设计,支持标识互联和端网协同传输,适应终端灵活迁移,扩展传统端到端的传输控制为端网协同,借助网络中融合的存算资源,显著提升数据传输效率和灵活性。

        - 普及算网一体化服务:利用算力网络技术赋能东西向流量,建立在算力网络架构下的云内微服务集群部署,确保集群内及跨集群的算力服务可通过全网路由高效互联,支持业务功能链的动态路由编排和策略执行。

       

        服务感知网络(SAN)作为CLOUD IP全场景智能云网解决方案的重要组成部分,不断进行技术创新。通过持续优化的关键技术和服务能力,SAN提升网络服务感知能力,促使IP网络从主机互联向服务互联演进,满足云网及算网融合各阶段的核心需求。SAN将支撑运营商实现云网战略,推动算网融合应用的发展,为数字经济构建新型基础设施。