家庭网关AI业务识别技术发展和应用

2022-08-16 作者:中兴通讯 王子晟
家庭网关AI业务识别技术发展和应用 - 中兴通讯技术(简讯)
您当前访问的的浏览器版本过低,为了给您带来更好的体验,建议您升级至Edge浏览器或者推荐使用Google浏览器
取消

家庭网关AI业务识别技术发展和应用

发布时间:2022-08-16  作者:中兴通讯 王子晟  阅读量:

家庭网关已经成为现代生活必不可少的基础设施,需要承载的业务种类也在不断丰富。运营商对于家庭网关的需求已经不仅仅是网络接入,高价值业务的用户体验逐渐成为主要的产品着力点。比如,国际运营商要求家庭网关对于以Skype、WhatsApp和网络会议为主的即时音视频通信应用进行Wi-Fi承载优化。另一方面,随着移动游戏业务的发展,家庭网关的游戏业务承载和游戏家长控制也成为用户主要的需求之一。业务识别是实现高价值业务保障的核心技术。

 

AI业务识别技术发展背景

 

早期主要依靠数据流的端口、IP和报文中的特定字段来识别业务。但是这种方式需要对于特征库进行维护,并且侵犯用户隐私。为了解决这些问题,中兴通讯家庭网关提供AI业务识别技术,智能识别游戏、语音和直播等业务。

AI业务识别技术从大数据中主动地学习业务特征,降低了业务识别技术的维护成本。非侵入式识别,不解析和读取用户的任何私密信息;高效的算法设计,实现零成本升级。AI业务识别技术对于游戏和直播等预设业务提供针对性优化,大幅降低时延和抖动,也为未来的定制需求提供了强有力的支撑。

图1展示了基于AI的业务识别算法的通用架构。多种业务的数据流从空口进入无线芯片,然后送入AI业务识别模块。AI业务识别模块根据预先训练的模式进行业务识别,并且根据业务特点进行针对性优化。

    图1  AI业务识别典型处理流程

 

AI业务识别算法技术特点

 

训练数据和算法是AI技术的基石。两者相辅相成,并最终决定了AI技术的整体表现。

训练数据可以分为两类,分别是报文数据和统计特征数据。常见的报文数据长度为64~2000bytes。一般来说,业务识别算法会截取报文前端的一小部分数据,并对不足部分进行补零。相比于报文数据,统计特征数据的数据量一般较小(小于100bytes)。报文数据包含了更多的信息,理论上可以实现更好的识别效果。但报文数据量相对较大,对于平台的计算效率提出了较高的要求,特别是对业务识别实时性有要求的场景。综上所述,应当考虑综合采用报文数据和统计特征数据。

算法分为机器学习和深度学习两个大类。机器学习算法的计算复杂度一般较低,适用于家庭网关等运算能力较弱的平台。并且机器学习算法的理论研究较为成熟,一般可达理论最优性能。同时,机器学习算法具有较好的可解释性,容易理解。

但机器学习算法无法实现精细的业务识别。各种学习算法的本质在于寻找一组可以把训练数据最好地分开的参数。机器学习算法参数的规模一般在几百到几万不等。深度学习技术将算法的参数提升到百万或者更高的级别,同时引入了非线性因素,使得深度学习算法可以实现更精细的识别。深度学习算法在业务识别的各个领域都实现了令人满意的效果。但深度学习算法耗时大,无法实现实时应用。特别是对于家庭网关来说,必须搭载额外的计算单元,比如神经处理单元。

 

中兴通讯AI业务识别技术

 

结合最新技术成果,中兴通讯在家庭网关平台中实现了AI业务识别,并进行了优化。

降低训练数据收集成本

训练数据的收集和标定是开展任何AI算法的前提。目前进行业务识别研究时,采用的是来自国外机构的开源数据集(比如ISCX2012)。基于这些数据的训练结果,无法适应国内的应用环境。其次,训练数据的标定也很困难,涉及到大量的人力成本投入。中兴通讯为AI业务识别提供了针对于国内业务的预训练数据集,同时开发了自动化的数据收集框架和软件,可大幅降低通用业务识别和定制业务需求的运营成本。

- AI模型优化

业务识别算法针对不同的用户,需要重新进行训练。为了降低算法的开发成本,需要避免“专家调参”进行性能优化。中兴通讯提供智能的AI模型训练算法,实现端到端的模型输出,保障输出模型即为最优结果。

- 家庭网关性能优化

目前家庭网关的性能难以承载AI业务识别算法,仅有部分经过精心设计的机器学习算法可以满足需要。中兴通讯提供优化的AI模型,可以在不增加任何计算单元的情况下应用于任一兼容网关中。

 

依托自身技术优势,中兴通讯在家庭网关中提供低维护成本、低升级成本的AI业务识别技术。运用该技术,运营商可以灵活且高效地实现定制化Wi-Fi承载服务,保障高价值用户体验。

分享到: