运营无忧:5G消息智能运维系统

2021-08-17 作者:中兴通讯 王巍,陈秀亮
运营无忧:5G消息智能运维系统 - 中兴通讯技术(简讯)
您当前访问的的浏览器版本过低,为了给您带来更好的体验,建议您升级至Edge浏览器或者推荐使用Google浏览器
取消

运营无忧:5G消息智能运维系统

发布时间:2021-08-17  作者:中兴通讯 王巍,陈秀亮  阅读量:

2020年是中国5G大规模商用年。中国移动、中国联通、中国电信在2020年4月8日联合推出《5G消息白皮书》。中兴通讯携手国内三大运营商共同推进5G消息平台建设、终端升级、产业生态建设、品牌传播,促进5G消息全面发展。中国移动在2020年11月率先完成5G消息八大区试商用建设,随后中国电信、中国联通也快速部署5G消息并具备商用条件。如何做好5G消息系统运维运营服务,促进5G消息业务更好地发展,不仅是运营商,也是5G消息从业者面临和需解决的课题。

 

5G消息系统运维&运营面临的挑战

 

5G消息的现网海量终端用户收发、Chatbot上下行、大区间交互,业务质量都需要保障;各终端品牌、型号、软件系统、SDK厂商、版本、UP2.4协议支持等5G消息能力千差万别,细分识别终端注册活跃情况、接入配置获取质量,是发展UP2.4终端用户和5G消息业务的关键;各Chatbot与用户消息交互业务量和送达率需要度量;用户通过5G消息收发文件速率需要分析,对发送/下载文件慢的用户需要针对性定位解决,提升用户感知。

5G消息系统采用NFV三层解耦云化架构、六大类VNF(SIP接入、DM、文件服务、短信模块、消息模块、MaaP平台)协同组网、上千台虚机大区集中化建设。如果遇到故障等问题,运维人员面临及时发现问题、快速定界定位的极大挑战。

大区集中云化部署使得5G消息服务器规模较大,面对上千台服务器,运维人员需要管理维护好这些设备和网络,简化升级操作、巡检工作等,降低OPEX。

中兴通讯积极探索、深入一线,贴合业务打造了一套智能化、自动化、可视化运维监控&运营分析产品体系,保障5G消息运维运营无忧。

中兴通讯5G消息智能运维&运营体系,由“多维业务分析”“实时运维监控”“智能决策”“运维运营Chatbot”“自动巡检”“一键升级”等产品组成,各产品各司其职,相辅相成(见图1)。

      图1  5G消息系统运维&运营体系产品全景

- 多维业务分析:运维&运营业务指标,多维DashBoard图表呈现,同时具备定时生成KPI指标能力,提供“运维运营Chatbot”或第三方网元使用;

- 实时运维监控:所有5G消息业务网元的进程/端口/日志/组件/异常日志/业务运维KPI等,秒级实时收集汇聚,指标组合监控告警,大盘展现,监控关键事件同步“智能决策”;

- 智能决策:从“实时运维监控”收集各组件的异常指标和告警数据等,根据预置经验策略集,组合分析,辅助运维自动决策,及时处置故障、恢复业务、降低损失,记录&通知处置结果等;

- 运维运营Chatbot:基于5G消息自身业务特色,扩展通道,从“多维业务分析”获取客户关心订阅的运维&运营KPI、接收“实时运维监控”告警、接收“智能决策”的处置通知等,第一时间下发5G消息到手机,图文并茂,方便易用;

- 自动巡检:场景巡检包和巡检任务统一管理维护,支持定时执行和一键巡检,巡检执行界面清晰可见,巡检结果汇总分级呈现等;

- 一键升级:升级版本包和升级任务统一管理维护,多站点升级版本一键下发,版本包提前自动到下放站点,升级操作边缘计算,支持各网元版本统一管理、升级历史回溯复盘等。

 

多维业务分析:构建领域专题指标体系

 

中兴通讯以5G消息终端、5G消息平台、Chatbot行业应用分三横,按用户拉新、用户活跃、消息使用、业务投放、应用排行划五纵,引入业务感知、业务发展运维运营一体化指标,细分领域专题,精心打造了一套覆盖全面、简单易用的“多维业务分析产品”,保障5G消息用户“上得去”(注册)、“稳得住”(收发成功)、“用得快”(业务时延小),提升用户体验。

 

实时运维监控:打造可视化集中监控系统

 

解决了各种业务分析难题后,还要考虑与业务无关的上千台虚机资源(CPU/内存/存储/带宽占用)、网络质量、进程状态、端口服务、异常日志等实时监控问题。中兴通讯分进程、端口、日志、指标领域细致梳理基础指标,由客户端周期采集上报、服务端实时收集,支持灵活的指标计算和逻辑组装,面向运维人员提供大盘看板、自助分析、故障告警、资产管理等实用功能,秒级实时发现系统问题,实现5G消息可视化实时监控和多VNF集中运维。

 

自动巡检&一键升级

 

大区集中云化部署使得5G消息服务器规模较大,面对上千台服务器,5G消息自动化运维势在必行。

中兴通讯5G消息系统除了支持NFV标准的生命周期统一管理外,OMC还同时集成各VNF的自动巡检、一键升级管理工具,将运维操作标准化、流程化,在节省运维人力投入、提升运维效率的同时,也大大降低了运维操作失误风险,极大提升5G消息运维质量。

此外,针对运营商传统短信的自动拨测、一键容灾的现有运维工具,中兴通讯大力支持、配合客户完成现网运维自动化系统在5G消息产品的功能落地,构成5G消息自动化运维整体解决方案。

 

运维运营Chatbot:指标&告警订阅,5G消息终端随时随地查看

 

“多维业务分析”解决了分门别类的业务指标问题,“运维实时监控”解决了设备、资源、进程、日志等异常实时告警监控分析问题。但运维和运营人员不是时刻都坐在电脑前的,如何随时随地获取系统KPI指标,系统故障告警第一时间被通知到?

中兴通讯创新性基于5G消息自身业务,构建了“运维运营Chatbot”产品。该功能支持设置客户关心订阅的运维&运营KPI、故障告警等,从“多维业务分析”“运维实时监控”等系统获取相应订阅内容,第一时间下发5G消息到运维运营人员手机,图文并茂呈现,随时随地,方便易用。

 

智能决策:运维故障根因分析,自动决策处置恢复

 

运维的目标是保障业务质量及系统的稳定性,为用户提供流畅的业务体验。传统运维系统感知故障后发出告警,或在系统发生故障后影响用户业务使用引起投诉后才被动介入。故障发生时,由于系统复杂,模块较多,根因告警常常被淹没在告警风暴中,影响问题的及时定位。中兴通讯积极探索和预研运维智能决策系统,收集5G消息各组件的异常指标、告警数据,根据预置经验策略集,组合分析,提供根因告警,同时自动处置(抓包/采集关键日志/重启等)。

 

结合运维和运营的各类诉求,5G消息智能运维&运营体系产品贴身服务,持续演进。我们相信在这套体系产品的支撑下,5G消息将更好地助力千行百业数字化、网络化、智能化转型,创造5G更大的综合效益和社会价值。

分享到: