大数据改变智慧产生方式 企业IT架构需先行应变

发布时间:2014-10-01 作者:摘自2014年7月23日《C114中国通信网》 记者 张月红

      近来大数据成为业界最热门的话题之一,事实上,几千年来我们一直在利用数据,数据并不是新概念。但大数据的价值最近几年才被公众关注到,这有着时代背景的原因。比如说石油,石油在几千年前就被发现了,但一直被用作日常生活或战争中的燃料,并不是特别重要的战略物资。在内燃机发明以后,石油成为最重要的动力能源,并在最近的100年中成为战略物资。


  如今,大数据也迎来了黄金时代,随着云存储、云计算技术的成熟,大数据的存储与处理能力有了技术条件。企业可以利用生产系统以及管理系统中产生的大量数据,一方面对自己的生产活动进行更为准确的预测与指导,从而提高生产活动的准确性;另一方面通过对大数据价值的挖掘,开发新的业务和服务。比如谷歌,仅仅通过搜索关键字的历史数据,就相当准确地预测了流感的传播路径。在这样的环境下,大数据才像石油一样,成为重要的战略资源。


  当然,各企业也都规划了自己的大数据策略,在2014第四届大数据世界论坛期间,C114采访了中兴通讯中心研究院副院长陈坚以及中心研究院总工王德政,分享了中兴通讯对大数据发展趋势的看法。

 

最大的变化是智慧产生方式


  就像每个人心中都有一个哈姆雷特,每个人对大数据的定义也各有不同。在陈坚看来,大数据的价值就在于透过表象,究其本质,提升人类活动的准确性,减少传统方式下的“试错”成本,从而提升效率。


  举个例子,在发生重大案件时,可以通过卡口的摄像资料,实时生成嫌疑车辆的运动轨迹与活动范围,提高案件侦破的效率。这些,归根结底,都是通过提高人类活动的准确性来提高整个社会的生产效率。


  王德政表示,中兴通讯作为一家拥有几万名员工的企业,本身也是大数据的拥有者,大数据应用的案例也是随处可见。同时,中兴通讯在项目研发的过程中,产生了大量的项目研发过程数据。在以往传统的项目管理中,衡量一个项目执行进度是否正常,基本上是依赖项目成员的主动报告。但项目成员有时会掩盖项目中实际的进度延误,以及项目执行情况的恶化。近期,中兴通讯在考虑针对项目研发过程数据进行建模,通过大数据的挖掘分析,对正在执行项目的健康度进行评估,与项目组的主动报告对照印证,尽早发现项目执行过程中的风险。


  陈坚认为,未来大数据挖掘带来的最大变化是智慧产生方式的变化。在传统的智慧生成模式中主要依赖人类专家。例如,你我是各自领域的专家,我们通过长时间的经验积累,可以在合理的时间内针对自己领域内的问题给出判断,这就是一个典型的智慧生成过程。而大数据挖掘带来的变化就是,大数据系统通过数据分析挖掘,累积经验库,并生成智慧,以减少对人类专家的依赖,至少是在数量上减少对人类专家的需求量。这样的情景,将会蔓延到各行各业,延伸到人类社会的各个角落,像文字的普及一样,将永久性地改变人类思考问题的方式甚至生活方式,这需要人类提前准备、适应这种变化。

 

大数据是运营商的必然选择


  但并不是所有的数据都具有价值,陈坚认为,一个高价值的数据集应该满足这样几个特征:首先,这个数据集应该与物理世界有较为广泛的对应关系,而不是纯粹的虚拟数据;其二,这个数据集不是纯粹的静态数据,而应该是可以实时更新的数据;其三,如果这个数据集具备物理位置等信息,将具备更大的价值。


  现在运营商对电信数据价值的认识和价值探索,也越来越深刻。比如,用户对服务质量不满意时,往往只有少数人会打客服电话进行投诉。不满意的客户,很可能在自己的亲友圈中散发大量的负面情绪。按照传统的通过客服主动大面积撒网去消除这种负面影响,就需要付出非常高的成本。如果利用收集到的电信系统中的过程信令数据,并加以分析,有效评估出客户体验最差的群体,再对这些特定客户群进行主动关怀,提高关怀行为的准确性,就能够以较小的代价,主动消除这些不满意客户所产生的负面影响。


  现在,大数据在电信业的应用,一方面用来改进网络本身,降低维护成本;另一方面通过分析挖掘开发新的业务,增加收入,这些都将成为电信运营商的必然选择。

 

适应需求的IT系统架构特点


  应用的需求,也对企业的IT系统架构提出了新的要求,比如要满足海量应用、在线计算。


  陈坚表示,中兴通讯近期推出的DAP平台在系统架构的设计中,采用清晰而标准的系统分层架构,可以根据不同行业的特点,方便快捷地引入第三方的软硬件模块,保证客户利益的最大化。DAP平台利用云存储与云计算技术,对海量的数据进行存储、挖掘分析,帮助企业充分开发数据的价值。


  王德政补充说,与其他的系统相比,DAP平台有三个最重要的特点。


  首先,DAP采用货架式架构,采用企业总线ESB的技术,可以灵活地对各个组件模块进行裁剪与拼装,满足“集成”与“被集成”的两种角色要求。当前各个行业已有大量的生产系统在线运行,完全重构这些系统无论从经济成本上,还是时间成本,都无法承受。所以,未来的大数据系统必然要同时承担两种角色:既可以作为原有生产系统的一个子系统被集成,也可以作为主系统去集成原有的生产系统。中兴通讯的DAP货架式架构灵活适应各类“集成”与“被集成”的场景,在不影响生产系统稳定性的前提下,与原有生产系统无缝集成,引入大数据系统。


  其次,DAP在数据分析挖掘层面的智慧生成的特征,可以提高企业活动的准确性。未来的大数据系统能否生成智慧,替代人类专家,是区分大数据系统与传统IT系统的关键特征。一个无法生成智慧的系统,无论数据量有多大,充其量也就是一个大型的传统系统,而不是大数据系统。DAP通过针对性的挖掘算法改进,可以做出超越人类专家经验与直觉的智慧建议,提升人类活动准确性,提高社会生产能力。


  第三点,DAP具备平台特性。DAP聚焦在数据的存储、处理时效、以及挖掘算法,为上层应用解决大数据应用的技术难点与障碍。上层应用可以根据自身的需求,快速地进行定制开发,以很短的时间周期与研发成本推出新的大数据应用。未来,DAP还可以对第三方开放,支撑第三方的大数据业务开发。


  根据他的介绍,目前中兴通讯的DAP大数据平台已经承载了电信、金融、政府相关领域的多个行业的大数据方案。

 

封闭研发很难成功


  从技术的角度来看,陈坚认为,大数据平台在各个行业中是相似的,可以采用相近的技术框架与方案,然后针对不同的应用特点做针对性优化。大数据应用对于各个行业的差异性则是比较大的,需要适应行业应用的不同解决方案。


  大数据作为一个产业链,任何封闭研发的尝试都是很难成功的。陈坚说,首先,大数据业务的实现天生具备定制化强的特点。所以,无论是电信、金融,还是其他领域,中兴通讯作为大数据技术的提供者,都必须与合作伙伴做紧密的配合,才有可能获得项目的成功。


  其次,在大数据领域,中兴通讯也在参与开源社区的工作,在为开源社区做贡献的同时,同时利用开源社区的智慧与资源。


  而且,中兴通讯通过与北邮等高校的技术合作,开始做针对性的技术预研,论证未来技术实现的可行性。


  对于一个大数据的系统,可以将其分成数据收集获取、存储计算、建模应用这三个层面。


  在数据的收集获取方面,业主本身就是这些数据的拥有者,需要考虑的是大量的对接、测试、谈判等工作,这就需要业主自身具备较好的数据收集、谈判能力。作为技术提供者,中兴通讯具备数据的接入、清洗等相关技术,可以协助业主做大量的实际测试与对接工作。


  在数据的存储计算方面,这往往是技术提供者最擅长的工作。对于中兴通讯来说,为了适应各个行业对大数据解决方案的需求,构建了公司级的DAP大数据平台,其所涉及的范畴正是数据的存储计算相关的领域。


  在数据的建模应用方面,往往需要业主与技术提供者协作工作,才能取得较好的效果。业主拥有自己领域的专家,可以整理出本领域的需求,中兴通讯的技术专家就可以根据这些需求,与业主进行协作,构建数据模型,完成新业务的开发。


  综合而言,在构建大数据系统方案时,业主与技术提供者是天生且必须的合作关系。业主更擅长于数据采集获取、数据建模应用相关的工作,技术提供者更擅长于数据存储处理、数据建模应用相关的工作。


  今天,大家都意识到大数据是和自然资源一样重要的战略资产,随着应用不断深入社会各个角落,大数据挖掘有可能会超越人类专家经验与直觉的智慧,势必会催生社会发展变革。