大模型在通信领域的应用探索

发布时间:2024-07-23 作者:中兴通讯 李瑞明

        随着5G网络的不断发展,运营商移动通信网络的规模越来越大,多频多制式共存也使得网络变得越来越复杂。在5G时代下,万物互联,各种新业务不断涌现,ToC、ToB业务需求各异,不同类型、不同能力的终端大量接入网络。传统的网络建设运营模式下,网络自动化水平低,网络生命周期各阶段割裂,“规建维优”人力成本高。为了应对上述挑战,自动化和智能化成为未来网络运营和维护的重要发展方向。

 

大模型推动自智网络意图驱动能力的演进

 

        TM Forum电信论坛在2019年引入了“自智网络”概念,并将“自智网络”分为L0—L5六个等级(见图1)。在L0—L3级别,用户的要求、目标和约束可以通过策略驱动操作来实现,并通过现有的接口传递要求。在L4—L5级别,系统将能够通过意图驱动的交互自适应地决策其自身的行为,减少对人类适应的需求,这种能力将通过引入新的定制服务而转化为业务灵活性,无需人类干预。自智网络的终极目标是实现“完全自智网络”,目前已成为通信业的普遍共识。当前来看,业界自智水平普遍处于L3(条件自智)阶段。

        在L3阶段,通过预定义、预测试的脚本和策略来自动化地执行网络操作,极大地提升了网络运维效率,但关键决策点仍依赖人的经验,需要人参与。随着自智网络向L4、L5阶段演进,很明显的变化就是最大限度降低网络运行对人力的依赖,网络能够自主制定最优方案并自动执行任务。根据TMF自智网络白皮书的定义,自智网络是根据指定的目标或期望进行管理的系统,这些目标或者期望就被称之为意图。意图包括以简化的方式抽象出来的要求、目标和约束,简单来说意图是“什么”而不是“如何”,即用户应告诉系统该做什么,而不是告诉系统如何做,这可以极大地降低工作的复杂程度。

        随着以ChatGPT为代表的大模型涌现,大模型前所未有地推动了自智网络的意图驱动能力的演进,也主导了当前业界的研究和实践。

 

构建大模型能力

 

        大模型建立在机器学习的基础上。机器学习是人工智能的一个分支,主要通过向程序提供数据,以训练程序在无人工干预的情况下识别数据特征。机器学习涵盖了多种算法和技术,如线性回归、支持向量机、基于神经网络的深度学习等。而大模型是一种具有大量参数(通常指100亿以上参数)和复杂网络结构的机器学习模型,这类模型通常使用大规模训练数据进行预训练,并且需要大量的资源来进行训练和部署。大模型通常包含以下几个特点:

        - 听得懂:模型能理解人类的意图,体现出较强的指令遵从能力。

        - 记得住:大模型可以进行多轮对话而不遗忘之前的对话内容。

        - 接得上:大模型可以从大量的用户交互中获得全面的用户关注点,并完善模型的任务场景,给出的答复很好地匹配用户的需求。

        - 说得顺:大模型的语言通顺程度和逻辑条理性已经超越大部分人类。

        自OpenAI发布ChatGPT以来,各大科技企业先后发布自研语言大模型,如META公司的LLaMA、Google公司的PaLM-E、百度公司的文心一言大模型、阿里巴巴的通义千问大模型等。

        基于大模型的意图识别能力,网络运维模式有望从“How to do”变为“What to do”,实现自然语言驱动、零过程干扰的极速业务体验保障。例如,在网络故障处理场景下,利用大模型的Function call和API映射能力,对结构化数据模型进行协同编排,快速完成异常检测和告警关联汇聚;大模型根据输出的结果,再进行二次分析、总结,生成故障摘要。在故障处置方案推荐、方案执行、质检闭环这3个环节,首先,通过大模型的RAG能力检索历史故障案例,生成处置方案;随后,通过人机交互完成意图识别和转交,执行故障自愈指令;然后进行交互质检,自助查询告警状态,达到故障处理的端到端闭环;最后通过大模型完成关联知识抽取,实现知识回收,实现模型能力迭代。

        中兴通讯基于星云通信大模型,打造无线网络保障助手,赋能事前、事中和事后三阶段各个环节,快速生成保障方案,执行感知评估、监控大屏、数据统计分析、跨域定界定位等各种保障任务,生成复盘总结报告,回收知识入库,显著提升重大场景的网络保障效率并大幅度降低运维人力。在乌镇互联网大会中,中兴通讯保障助手基于大模型实现无线网络保障场景端到端闭环创新实践,利用AI生成式对话交互,革新传统运维方式,提升操作效率,保障人力投入降低30%以上。

 

大模型面临的技术挑战及应对策略

 

        相对传统手段,大模型能较好地解决意图识别的能力,但在网络自动化、智能化运维场景仍存在一些挑战。

        - 大模型幻觉:幻觉指大模型内容生成时,生成的信息与现有来源相冲突,或无法通过现有来源验证。幻觉会误导大模型生成非预期的输出,而运维领域对错误容忍度低,需要尽量避免幻觉产生。

        - 可解释性弱:由于大模型为黑箱模型,且具有复杂的神经网络结构,生成的内容可解释性较弱,而运维领域对结果的可解释性要求较高。

        - 运维语料不足:大模型落地过程中运维领域语料较少,特别是私有语料,质量和数量都不足。

        - 存量工具结合:大模型如何结合现有网络中大量的网络自动化运维工具是需要考虑的问题。

        对于大模型面临的挑战,目前已有一些解决方向,如为了避免大模型幻觉,并做到结果可解释性强,可以通过检索增强,增大显式知识占比,类似知识图谱的方式,用“有据可依”的生成策略提供可解释性。关于结合自动化运维工具,可以利用智能体的方式,把已有的工具和AI大模型结合在一起。

 

        大模型作为人工智能领域的重要技术,正在推动各行业的数字化转型。在通信领域,大模型提供的自然语言处理、意图识别等能力为基于意图的自智网络建设提供了更加智能和便捷的解决方案。随着技术进步,应用场景不断扩展,大模型将在通信领域发挥越来越重要的作用。