算力网络加持,多维视频业务迎来大发展

发布时间:2022-08-20 作者:中兴通讯 徐火顺,毛连贵

        随着5G、千兆光宽、Wi-Fi 6等千兆网络的建设和商用的不断深化推进,以及AI、边缘云、vCDN等算力技术的加持,视频已全面融入我们的日常生活,影响着我们与世界的连接方式、沟通形式,成为数字化进程中确定性的基础能力。

        在全千兆网络时代,视频正向超清化、多维度、沉浸式和强交互方向发展。传媒行业涌现了众多高新视频业务,如虚拟现实VR(Virtual Reality)、帧同步多视角MVV(Multi-Viewpoint Video)、360°自由视点FVV(Free-Viewpoint Video)和2D转3D等多维视频业务。视频业务从传统的平面视频和单向传播视频,向多维视频和交互视频升级,增加了用户的参与度和沉浸感,提升了视频应用体验。

 

技术支撑底座

 

        多维视频业务以全千兆网络、视频采编播存传技术,以及终端的解码和呈现技术作为技术支撑底座,实现越来越多的场景应用。

        网络方面,千兆光网络、Wi-Fi 6和5G网络的发展为超高清多维视频提供了坚实的网络支撑;视频采编播存传技术方面,前端超高清采集、超高清编码、新的压缩编码技术、AI识别、虚拟视点、画质增强、FOV等视频创新技术,为丰富多样的视频体验提供技术支撑;终端解码和呈现技术方面,大屏、小屏、智慧中屏以及可穿戴式装备,提供了风格多样的终端模式,满足用户多样化需求。

        全千兆网络结合边缘算力形成了算网一体化,而多维视频业务依托于算网一体化,面向千行百业增强了视频应用的广度和深度。除了算网一体化的支撑,多维视频业务也离不开云计算、大数据、编解码等多种技术能力的支持,基于这些全方位的技术发展,多维视频业务获得快速发展。

 

整体方案和关键技术

 

        多维视频业务从技术架构上主要由视频采集、视频处理、视频分发和视频播放4个部分组成(见图1)。视频采集部分是在前端场地部署摄像头/摄像机设备,进行实时摄像并编码,通过专线或有质量保证的网络将视频码流传送到系统端;视频处理部分是部署在机房的设备,对收到的视频进行增强处理,包括协议转换、识别、聚合、变换、增强等处理,以形成面向场景的视频媒体流;视频分发主要采用CDN技术,采用合适的传送协议将视频分发到有需要的地方并按照需求进行存储或缓存;视频播放是通过终端连接到视频分发网络,获得媒体流解码并按照场景进行渲染呈现。多维视频场景主要包括帧同步多视角、360°自由视点、8K VR FOV、2D转3D等业务。

 

Network diagram

                                                                                     图1   多维视频业务技术架构

 

帧同步多视角

        多视角是指赛事等活动播出时,通过多路摄像机摄像编码后同时向用户推送多个不同视角的独立视频画面,让用户可以自行选择观看视角或同时观看多个视角。多视角打破了传统电视转播的规则,由用户决定观看视角,从而获得个性化体验。

        由于多个视角视频采用独立传输,在摄像、编码、传输、中继、缓存、解码、渲染呈现等多个环节不可避免地存在不同步现象,采用多路帧同步技术来保证每个用户对多个观看画面在帧级别上完全同步,实现多视角画面的一致性。

        核心技术多路帧同步,在摄像机端用同步信号发生器实现信号同步,视频编码时置入同步标签,在客户端播放时解析多路画面帧同步信息,并在最终呈现时实现帧对齐,让用户在多路视角切换时,所有画面时间保持高度一致。

 

360°自由视点

        自由视点业务是指以赛事等活动场景为中心,采用多机位或环绕机位拍摄,获得一定范围内环绕焦点多角度的视频信息,经过制作、传输、分发、播放等环节,能够让用户通过操控界面,从任意角度自由旋转观看被拍摄物体/场景的业务形态。

        自由视点业务可以充分发挥多角度、多细节、自由观看的特点,让用户从不同角度欣赏视频,以交互方式自由旋转,增强参与感、交互感,摆脱对传统导播视角的依赖。

        自由视点业务还可以应用在特效场景的制作,呈现出子弹时间和定格环绕的效果。虚拟视点、AI识别等增强技术,使自由视点业务呈现出更加优秀的用户体验。

        自由视点业务的核心技术包括毫秒级同步推流、AI视频实时防抖算法、多路4K实时编码技术、智能校准&相机控制、超低延时自由视点视频编码、虚拟视点、AI识别、实时子弹时间等特效视频技术。

 

8K VR FOV

        受限于终端解码能力和网络带宽限制,目前VR视频多为4K VR,用户实际观看的画面画质较低,严重影响用户体验。8K VR对传输带宽和终端解码能力要求比较高,支持8K解码的终端设备还没有普及。因此VR业务的清晰度和资源要求存在一个矛盾,而采用FOV技术可以很好地平衡这个矛盾。FOV技术的原理是在系统端设置专门的编码服务器,对超高清的VR视频进行分层分块的编码,如8K VR视频,可以采用一个2K的360°视频,加N个分区编码的超高清小分片视频,这样在终端解码呈现时,先采用2K视频打底呈现,再基于视场角位置实时快速地获取对应的小分片超高清视频进行叠加渲染呈现,在保证视场角内视频呈现的质量基础上,大大节省传输带宽开支,同时降低了终端解码要求,可以实现4K终端体验8K VR画质视频,带宽节省70%以上,转头时延低于150ms。

 

2D转3D

        通过2D转3D能力引擎,在2D视频的基础上,利用AI技术,制作生成3D视频,解决3D视频资源匮乏的问题;同时支持将直播信号实时制作为3D视频信号,实现3D直播业务。

 

算力网络助力多维视频业务按需部署

 

        多维视频业务在教育、医疗、体育、文旅等行业正在蓬勃发展。其中教育行业主要是互动业务,包括远程课堂、多人互动、360°展示等;医疗行业主要应用在远程门诊、专家会诊、手术在线等场景;体育行业主要是智慧观赛等直播业务,支持多视角、自由视点,以及超高清VR等,面向场内小屏用户和场外大屏用户;文旅行业主要在慢直播、景点在线,以及通过AI技术为游客量身打造游览过程的视频集锦的场景业务。

        除了以上行业,矿山、公安、法院、渔业、家政、工业生产等多种行业也采用多维视频等超高清视频增强服务,提升服务水平。

        千行百业的视频业务,需要全千兆网络的支撑外,也需要就近于用户的视频接入或视频服务的能力。算网一体化的算力网络将有力支撑多维视频的发展。帧同步多视角、自由视点、虚拟视点、画质增强、AI识别、视频剪辑,以及FOV、2D转3D等业务和功能,可以快速在算力网络中按需部署,支撑多维视频就近服务。如图2所示,根据业务场景和现场机房、网络等条件不同,算力网络可满足灵活的组网模式,集中部署组网或分布式组网,且具备模块化和组件化特点,可根据业务需要按需部署。

Network diagram

    图2   算力网络下多维视频业务按需部署

 

        全千兆网络的发展,有力支撑了多维视频等超高清视频在千行百业的应用,算力网络促进了多维视频的就近服务和服务质量提升。多维视频在各行各业的普及应用,将提升人们的生活质量和生产效率,拓展人们体验世界的方式。