大数据当前面临的问题
大数据之所以能提升社会生产效益,其本质是提升人类生产活动的准确性。鄂维南院士曾经指出:“大数据本身并不能带来直接效益,它不能吃也不能穿,但它可以消除浪费。”
在大数据诞生以前,智慧很难通过机器获得,智慧发现都依赖于各行业的专家。当前通过大数据挖掘的手段,可以依托海量的知识库,将输入的知识(或信息)转化为智慧,指导人类提高社会活动与生产活动的准确性,并最终提升社会生产力,产生巨大的社会效益。
任何一项技术要具备社会效益,必须满足两个前提。其一是技术可行性,即该技术当前是否有相应的实现手段;其二是经济可行性,即采用该技术构建的系统(或产品)是否能够获得盈利。大数据技术同样需要满足这两个可行性前提才能获得大规模社会应用。
2014年Gartner发布的HypeCycle曲线中,大数据技术处于炒作顶点之后的衰退期。从HypeCycle曲线来看,越过炒作顶点处于衰退的技术,一般已经满足技术可行性。对于大数据的技术可行性,在以Hadoop为核心的开源体系促进下,除了部分尖端领域外,应该说当前已经基本具备技术可行性。
但对于经济可行性,在项目的实施过程中往往考虑不足,例如,项目建设目标不明确、项目初始投入远超业务需要等,将导致项目运营难以达到期望的效益。
所以,对于大数据建设项目,需要重点考虑的是经济可行性。
大数据的盈利模型
大数据项目的建设模式,往往是建设一个大数据平台,然后在平台上叠加多个应用。但大数据平台本身并不能产生经济效益,所有的经济效益,都需要靠相应的应用与经营来体现。所以,在项目规划初期,就需要重点考虑大数据平台上所构建的业务,并考虑相应的商业模式,以最终实现建设项目的经济可行性。
大数据项目的效益点(或赢利点),如图1所示,主要体现在3个方面。
效益点A为“系统轻载”。对于需要存储大量历史数据的企业来说,在生产系统存储历史数据,不仅代价高昂,而且会影响生产系统的稳定性。所以效益点A是一种“接近于本能的刚需”,例如,银行、证券等企业仅仅将历史交易查询系统迁移到大数据平台中,就可以极大地减轻生产系统的负荷,提升生产系统的稳定性。
效益点B为“闭环应用”。大数据平台通过收集生产系统产生的业务过程数据,并对业务过程数据进行建模,对当前生产系统提出改进建议与分析报告,去除或改进现有系统中不合理的环节,提高系统生产效率,降低成本。例如,通过收集无线网络的网络覆盖相关信息,可以指导网规网优工作,与传统依靠路测的网规网优模式相比,无论是资金成本还是时间成本,都急剧降低。再比如,电子商务的推荐系统,通过电子商务网站产生的数据,分析用户的属性与标签,形成推荐结果后反馈给电子商务网站,可以促进销售,形成闭环反馈。
效益点C为“开环应用”。主要是通过第三方实现数据变现,例如,利用电信运营商的数据进行道路规划、人流量密集度预测,或通过数据的经营与交换产生相应的收益。由于开环应用较难形成稳定的收入,数据产生的最终价值由于缺少反馈且难以衡量,较难形成相应的闭环。
在项目的建设初期,效益点A与效益点B业务目标容易聚焦,较容易形成经济效益;效益点C虽然在项目初期较难形成经济效益,但与效益点A/B相比,在远期能够带来更多的收益。所以,在大数据项目建设过程中,在哪个阶段建设哪个类别的业务,建设顺序至关重要,甚至可以决定整个项目的成败。
一般来说,在项目建设的初期,可以考虑先选择较易产生经济效益的闭环应用,使项目形成经济上的自我造血功能,然后再依托所积累的数据,进行开环应用的拓展。这样的建设顺序,将有助于提升项目成功的概率。
大数据生态系统形态
基于大数据平台的系统,一般来说,可通过闭环应用获取并积累核心数据,然后通过开环应用构建应用生态圈。
一个健康的生态圈,必须具备在生态圈内解决经济可行性问题的能力,即,生态圈的各类应用(系统轻载、闭环应用、开环应用)能够产生合理的总收益,使其具备商业可行性。
当前,各领域都有很多数据生态系统处于建设状态。未来,随着市场竞争的加剧,不具备经济可行性的生态系统将逐渐被淘汰或整合,在行业领域内,将出现少数几家占据支配地位的强势生态系统。各个强势生态系统在其生态圈内解决经济可行性问题,挖掘数据价值,实现数据变现。
如图2所示,未来强势生态系统之间,将按照互利等价的原则进行数据的流通与交换,实现生态系统间的协作与共同繁荣。少量不在生态系统内的数据,将可以通过数据交易所进行自由交易,实现数据社会价值的最大化。
我们生活在一个大数据爆发的时代,随着大数据在各个领域逐渐具备经济可行性,未来的大数据服务将无处不在。中兴通讯DAP大数据平台具备数据封装与开放能力,具有快捷方便的应用开发环境,可以帮助客户分阶段地规划与建设大数据生态圈,减少初始投入,降低大数据项目的风险。