“AI+”新通话,语音业务新一轮起跑

发布时间:2025-03-03 作者:中兴通讯 倪明

        新通话的发展,既有用户希望改变单一的通话内容和通话形式的需求驱动,也有运营商应对外部挑战的内在动力。特别是随着AI技术的发展和应用,来自于终端公司和OTT的竞争态势进一步加剧,运营商面临着如何提供更优质服务以获取竞争优势的挑战。

        根据工信部的数据,截至2024年8月底,中国5G移动电话用户达9.66亿户,移动电话去话通话时长为1788亿分钟/月。运营商通话业务仍是刚性需求,且用户规模巨大,这是运营商所拥有的强大的通话业务入口。通过在新通话的音视频通道和数据通道上引入AI技术,实现多模态交互,把原生通话拨号盘打造为智能应用新入口,将助力运营商从通话时长运营向多模态内容运营转变,扩展其变现手段和能力。

 

“AI+”新通话创新方案及应用探索

 

        为支持新通话创新业务发展,中兴通讯在实时通信基础网络IMS方案架构上进行了多方面的持续创新,包括Data Channel、能力开放、小程序、AI等技术的引入和应用。

        在AI技术支持方面,为满足创新业务对媒体多模态智能转换处理的低时延、高可靠、易扩展要求,中兴通讯联合中国移动率先推出媒体面插件化技术,以敏捷底座创新方案实现AI能力在线部署,支持创新业务的快速上线。

        如图1所示,媒体面插件化架构分为四层,包括服务层、框架层、能力插件层和支撑层,其中服务层、框架层、支撑层是系统的基础功能,能力层是系统的可选功能,可根据需求选择性加载。

 

  • 服务层:负责媒体服务接口的处理,并转化为插件编排;
  • 框架层:包括流水线引擎,根据编排加载插件,执行流水线;
  • 能力插件层:包括自有插件和第三方插件,插件类型分为编解码等基础媒体处理插件、XR等多模态媒体处理插件、人脸识别和意图识别等AI处理插件;
  • 支撑层:提供插件运行环境。

        插件化架构实现插件能力与系统解耦,在保持系统稳定性前提下,通过插件的灵活编排实现新能力、新功能的快速部署上线;另一方面,基于标准化的插件架构和接口,实现AI能力和新媒体处理能力的集体创新和生态共建,助力“AI+”新通话的发展。

        敏捷底座创新方案实现通话与AI的结合,不仅提供了焕然一新的新通话体验,更扩展通信服务范围,实现全新的商业闭环。

        AIGC所具备的强大内容创作能力可以极大地降低内容创作的门槛和成本,在新通话点亮屏幕业务中为个人和企业用户提供丰富多彩的个性化展现。

        基于AI Agent的通话助理在通话过程中识别意图,生成相关图像视频以提升交互效果。如通话交流中谈论到某个景点或某个商品功能时,通话助理可以将相关信息的图像、视频实时发送到终端屏幕上,向用户提供直观展现。AI通话助理还可以提供智能代答,避免漏接电话,在代接亲人、朋友、同事等不同身份来电时,可以创建相应的拟人化效果,代入感情色彩,提供情绪价值;对于陌生来电,则可以通过AI通话助理实现防骚扰、防欺诈。

        通话助理可进一步通过第三方应用,实现用户的订餐、旅游、金融等服务,在通话中实现增值服务闭环。

        面对行业应用,不论是业务营销、客户关怀,还是售后保障等,“AI+”新通话可提供“更高效”和“更经济”的服务,帮助行业用户提升经济效益和社会效益。如AI智能客服可为用户提供更加快捷和个性化的服务体验,而通过屏幕共享、AR标记等远程指导,可以极大提高服务效率,降低服务成本。

 

实践及展望

 

        结合5G-A和AI技术的发展应用,中国移动牵头中兴通讯等厂商,率先展开新通话的研究探索、测试验证及商用推广,已先后商用开通趣味通话、通话字幕、智能翻译、点亮屏幕、明星来电、商务速记等业务,有效提升了通话的趣味性和服务质量,用户稳步增长,业务发展态势良好。

        国内主流运营商在积极开展新通话试点和商用部署,海外运营商也对新通话产生浓厚兴趣,开始布局试点验证。新通话正在走向全球。

        新业务需求、新技术发展共同驱动实时通信网络持续演进。目前国内领先运营商已开展下一代实时通信网络的研究,并牵头在ITU-T完成需求立项;中兴通讯积极参与运营商下一代实时通信网络的需求及架构研讨、白皮书的编写及发布。

        下一代实时通信网络架构将原生具备AI能力,从内容生产、网络控制、媒体处理等多维度实现全面智能化,支持多维感知沉浸式、虚实融合的业务体验,助力运营商加快商业变现。