vBRAS资源池智能运维方案

2022-07-21 作者:中兴通讯 王怀滨  
vBRAS资源池智能运维方案 - 中兴通讯技术(简讯)
您当前访问的的浏览器版本过低,为了给您带来更好的体验,建议您升级至Edge浏览器或者推荐使用Google浏览器
取消
vBRAS资源池智能运维方案
发布时间:2022-07-21  作者:中兴通讯 王怀滨  阅读量:

当前国内主流运营商既有的城域网和无线承载网两张网,存在网络利用率不均衡、新业务建设周期长、建设成本高等问题。为了解决这些问题,并考虑网络的长期演进,各大运营商展开了新一代城域网方面的研究和试点,现已逐步开始规模商用部署和业务承载。

新一代城域网vBRAS控制与转发分离架构的引入,实现了宽带接入业务ICT的融合。vBRAS-C需要部署在CT云内,通过虚拟化技术实现虚机自动部署、热迁移、动态弹缩等特性。vBRAS-U部署在城域网内,实现业务的高速转发。和传统的BRAS设备相比,vBRAS由原来BRAS单一网元演变成若干组件组成。原来一台功能高度聚合的电信运营商设备,演变成若干功能组合的ICT融合设备形态。这种架构上的改变带来了正反两面的影响:正面来看,可以使网络更加灵活、资源利用率提升、可靠性提升等;反面来看,也带来网元类型和数量增加、业务路径拉长等弊端。

和传统BRAS设备相比,vBRAS带来的最大变化是运维方式的改变。vBRAS场景下业务的故障定界和定位更加复杂。本文要讨论的就是vBRAS部署在资源池内实现什么样的智能运维方案?要解决哪些主要问题?我们总结了实际部署中的几个关键问题:资源池的统一纳管问题、资源池内不同网元之间的根因关联问题、故障定界/定位问题、业务质量感知和打分系统、自动运维和绿色节能等问题。

 

资源池的统一纳管问题

 

新一代城域网vBRAS的资源池涉及防火墙、DCGW、EOR、TOR、服务器、VM、VNF等各种物理网元和虚拟网元。这些网元的统一纳管是资源池内管理的核心。电信运营商的一跳入云方案,需要有全局的拓扑和视图。拓扑需要呈现物理拓扑、业务拓扑、链路质量等重要指标。而现状是,资源池内目前没有统一的管理系统,统一的纳管需要通过运营商的统一采控平台去关联和呈现,这对运营商的管控系统提出了很高的要求。运营商的采控平台不但需要去适应变化,而且需要去适配不同厂商的设备和网元,导致对接复杂、对接周期长。

当前中兴通讯正在进行vBRAS资源池统一纳管方案的规划和开发,在资源池内通过厂商的管控系统实现统一纳管。中兴vBRAS资源池统一部署方案,实现在资源池内所有设备和网元的统一纳管,简化资源池内的维护,为快速故障定位和分析提供强有力的保障。如图1所示,方案通过中兴通讯的ZENIC ONE统一实现了资源池内NFVI和VNF网元的统一纳管。

 

       图1   vBRAS资源池统一纳管架构图

资源池内根因关联问题

 

前面我们讲到了资源池的统一纳管,但仅做到这一步是不够的。当资源池内某物理网元故障后,通过故障繁殖,整个资源池内很多网元都可能发送告警等信息。面对大量的告警信息,通过人工方式很难快捷判断网络究竟发生了什么问题。因此,我们迫切希望这些告警能够自动关联和合并,直观、直接地呈现故障根因。

有了资源池的统一纳管,就具备了事件集中分析的基础,也就具备了根因关联的基础。通过预先制定根因规则,我们可以在统一管控系统形成根因表,从而实现故障的快速定位。故障的自动快速定位是自动运维的基础能力之一,根因关联和运营商的生产系统对接,可以高效实现资源池内故障自动定位和问题解决。图2是vBRAS CT云资源池的告警根因关联图例。

           图2  vBRAS CT云资源池根因关联原理

 

新一代城域网内的故障定界、定位

 

新一代城域网vBRAS的不同组件包括部署在资源池内vBRAS的控制面和软转发面,以及部署在城域网内的高性能硬件转发面。vBRAS的业务路径从城域网接入到新一代城域网,再接入到资源池内的vBRAS控制面、软转发面,或者接入到城域网内的vBRAS硬件转发资源池。vBRAS的控制信令路径、业务路径都非常长。当业务出现故障,为了找到故障网元,传统方式一般采用逐段ping、逐段debug、逐段日志分析的方式。这种方式定位繁琐、定位周期长、定位效率低。在当前5G业务高速发展的时代,自动驾驶、在线医疗、在线教育、远程会议等业务应用越来越广泛,对网络的可靠性、健壮性要求也越来越高。因此,在新一代城域网内一定需要引入更加高效、智能的故障定界和定位手段。

中兴通讯通过自研的控制器结合IOAM、TWAMP、Telemetry、SRv6 Policy等新技术,实现了城域网内不同层次设备间的故障定界:OLT-ALeaf-Spine-SLeaf-vBRAS-U;也实现了vBRAS控制面和转发面之间不同逻辑通道的故障定界:CUSP通道的故障定界、VxLAN通道的故障定界、Netconf通道的故障定界;还实现了vBRAS控制面之间的通道故障诊断和定界等。

故障定界后需要精确快速地进行设备内的故障定位。中兴通讯数通产品提供的易维工具,可实现系统日志和业务数据的实时高性能采集。通过高性能日志数据的对比分析,可以准确定位到具体的故障点,结合前面讲到的根因关联分析,可以实现高效、准确的故障定位。

 

新一代城域网内的业务质量感知和打分

 

在新一代城域网内,vBRAS系统可以部署业务自动感知系统,对网络、用户、业务进行打分,并且输出分析报告,从而实现vBRAS业务整体的健康度评价。业务的自动感知有探针方式和业务报文自动感知方式。采用探针方式的,如基于业务的IOAM染色机制,可以准确采集到某种业务的丢包、时延、抖动等关键指标,也可以实现某段路径的分析,但是缺乏端到端标准,对于端到端的方案比较困难。

中兴通讯vBRAS产品能够提供独立的业务质量感知系统。通过业务质量感知系统,不需要端到端的探针,仅通过对业务自身报文的感知,就可以实现端到端业务的质量感知和业务质量定界。

IOAM和业务质量感知系统结合,可以实现端到端业务路径的分析和故障诊断。通过打分系统可以对用户网络和业务质量进行实时呈现,还可以实现和运营商生产及运维系统的快速对接。

 

自动运维和绿色节能

 

采用中兴通讯vBRAS方案,vBRAS的控制面组件和转发面可以分别根据策略形成资源池。业务在资源池内自动进行负荷分担和调度。同时,通过中兴通讯的控制系统,可以根据设备的资源利用率情况,动态调整用户的接入点,对空闲的设备和单板采用关电、睡眠等方式,实现动态的绿色节能。

 

中兴通讯vBRAS资源池智能运维方案,立足当下,放眼未来,为运营商网络的虚拟化、智能化演进添砖加瓦,为未来网络和新业务的发展提供平滑演进能力。

本期相关文章