大视频趋势展望

发布时间:2018-03-30 作者:李伟军(中兴通讯)

  关于大视频的未来方向,有些趋势是明显的,例如越来越多的视频会通过IP通道以流媒体方式传送,视频占据互联网流量的比例日渐上升等;而另外一些趋势则众说纷纭,莫衷一是,例如虚拟现实是会成功还是夭折,非国际标准视频编码器是否有生命力,等等。本文尝试探讨大视频未来的一些趋势,愿与业界同仁切磋。

  对于人类社会的发展,笔者有个粗略的分类总结。在农业时代,最重要的生产工具和产品是土地和粮食;在工业时代,最重要的是工厂、机器和商品;而在信息时代,最重要的产品是信息和内容。所以说,信息时代,内容为王,涵盖内容生产、分发、商业化的生态圈,是人类社会的核心活动之一。其中一个例证,就是全球市值最高的公司排行榜上,越来越多的是快速成长的信息产业公司,而传统产业的巨头们日渐退位。大视频,也包括虚拟现实、增强现实、混合现实等,因其最直观、最丰富,是信息和思维的最佳表现方式,所以视频行业的繁荣是大势所趋,无可置疑。

  但是在日益繁荣和激烈竞争的大视频行业如何盈利,则是见仁见智。抱残守缺的,前途黯淡,只有勇于探索尝试新颖商务模式的服务商,才有可能得到用户认可,从而发展壮大。Netflix在订阅式视频点播套餐(Subscription VoD)和自制内容原创大片方面近20年来敢为天下先的曲折探索和成功,可谓明证。在以内容消费为主的“眼球经济”中,我认为有三个最基本的价值原则:一, 每个用户的眼球时间是有限的,因为人的一天只有24小时,而能用于内容消费的时间、精力、财务更加有限;二,只有最新最优质的内容对于大众用户有吸引力,享有最高溢价;三,不同的长尾内容和草根内容对不同的用户群也有吸引力和价值,但是只有精准地找到这些用户,恰当地推送给他们,才能变现这些价值。因此,未来的大视频商务模式,在于如何利用大数据和人工智能技术,以更聪明更精准更创意的方式,变现“优质内容+长尾内容+免费内容+广告”。

  4G已经遍地开花,5G时代马上来临。5G会给视频行业的用户、运营商、设备商带来什么样的冲击呢?5G能够随时随地提供超高的上传带宽和下载带宽,接近于现有的光纤入户和家庭WiFi的速度,并且每比特信息的传输成本会量级下降,所以智能手机很可能取代电视屏成为用户随时随地发现和观看视频的主要屏幕,而不是目前作为辅助大屏电视的第二屏。用户使用智能手机往往是碎片化的零星时间,但是全神贯注,而非观看传统电视时占用大块时间但注意力不集中。这可能意味着新技术要让用户在智能手机上方便地浏览和预览视频内容,以及编排内容队列,回到家再传送到大屏幕电视上慢慢欣赏。因此,大众化的广播,会逐渐让位给个性化的直播和点播。而且,以竖屏模式拍摄的视频,在传统电视上不合适,但是在智能手机为主的移动视频时代,却大受欢迎,这是一个明显而巨大的变革和机会。

  作为高效分发IP视频的核心子系统,内容分发网络(Content Delivery Network),也会从传统的层次系统(源节点/中心节点/边缘节点),演变成网状的架构。这是因为在5G时代强大的上传带宽会让草根用户随时随地拍摄的本地内容激增,这些本地内容会就近注入最近的CDN节点,以此作为源节点向其他节点传播,让全网其他的用户高效享受。

  如何能让企业和普通消费者便利地制作、存储、传播内容?在线视频系统(Online Video Platform/OVP)方兴未艾。OVP的主要作用就是提供一个开放的视频内容和业务的创建、编辑、存储、分发、计费平台,让运营商自己的IT服务人员和任何第三方的开发者来开发创新的视频业务,包括从运营商到用户的业务(例如直播、点播、云录制),从用户到用户的业务(例如游戏、社交、在线视频分享门户),以及从企业到用户的业务(例如在线教育、家庭监控)。

  大视频的效率和成本与音视频的编码格式密切相关。H.265这样的国际标准编码器的专利授权费用不很确定,所以业界现在致力于一些新的开源的编码格式,比如AV1。因为IP视频点对点编解码的特性,只要终端能够解码就行,与中间传输环节无关,因此私有的非国际标准的编解码格式应该是有可能成功的。

  人工智能(Artificial Intelligence)正在革命所有的行业,尤其是音视频行业。随时待机能够远程聆听和理解用户自然语言说话和命令的智能音箱,因其自然的交互方式,有可能取代智能手机成为用户生活的一大主要入口门户。当然语音交互和实现也有其局限性,例如语音朗读菜单远远不如屏幕显示一目了然。对于视频内容本身的智能识别和加工,会是一大崭新方向。也就是说,以后的机器学习系统完全可以像人类一样,能够识别每个视频画面中有哪些物体(例如摩托车、汽车、大楼、人物),而且理解具体个例的人文、历史、情绪属性,例如不光识别到某一副画面上有两个人,还能识别出他们是谁,什么表情,在讨论什么,上下文前后线索如何。当机器识别达到这个程度时,就可以作更智能的加工了,例如给画面中出现的景点、人物、衣着、车辆自动增加标签和提供更丰富的附加内容,可以在当前电视上显示,或者在手机屏显示,或者在增强现实的眼镜中显示。这些标签,又是可以根据大数据来为每个用户个性化定制的。在这些技术上,基于视频内容的智能识别的个性化广告植入技术,会更合情合理,天衣无缝。

  人工智能提升的是大视频业务的聪明程度,而沉浸式体验提升的是大视频业务的基本核心感受,比如说超高清4K、超高清8K、虚拟现实、增强现实、混合现实等,提升的是用户消费视频内容时的愉悦感和真实代入感。例如混合现实(Mixed Reality/MR),允许把现实镜头看到的场景分层识别解析,把某些中间层次的现实物体,替代成虚拟物体,这样的融合更自然真实,而不是像当前的增强现实技术一样只能把虚拟物体叠加在现实场景的最上层,看起来比较突兀。

  大视频也是人类情感社交的方式之一,例如当今很红火的电视弹幕功能,允许用户们在屏幕上共享实时评论。不远的将来,更会有虚拟电影院这样共同观赏评论的更立体全息的观看模式。

  大视频不只是为了娱乐消费,也是最有效的学习方式。基于虚拟现实、增强现实、混合现实的操作培训方式,目前只是给专业的飞行员训练或者类似训练,但是变成消费级的产品和业务,走进千家万户,也是指日可待的。

  无人敢言未来一定如何,只有去创造未来,才能把握未来。