大数据安全挑战和应对策略

发布时间:2015-02-01 作者:于波(中兴通讯)

      目前,全球数据量出现了爆炸式增长,根据互联网数据中心IDC的统计,全球数据量仅在2011年就达到1.8万亿GB。预计全球数据量到2020年将可能增加50倍。


  随着互联网数据量的高速增长,数据类型也呈现多样化发展趋势。随着互联网技术的快速发展,过去以二维结构呈现的数据,开始转化为以视频、音频、图片、邮件、网页等为主的非结构化数据。多样化的数据具有低密度的特性,即需要对海量数据进行挖掘、分析,才能得到真正有用的信息。


  针对大数据的这些特点,一方面,要为海量的、多样化的数据提供存储和运算平台,通过数据挖掘等方式,从大数据中发现高价值内容。另一方面,大数据的发展进一步扩大数据的开放程度,引发越来越多的隐私或者敏感数据的泄露事件。面对大数据发展的新特点和新形势,数据安全保障是我们需要面对的重大挑战。

 

大数据面临的安全挑战


  互联网时代,大数据已经渗透到各个行业领域,并逐渐成为一种生产要素,发挥着重要作用。随着大数据重要性的不断提高,信息安全方面的挑战日益紧迫。

 

移动数据安全压力增大


  互联网的各种应用,如电子商务、社交媒体等的兴起,使得更多更重要的数据在移动设备间传递,给一些恶意软件可乘之机,他们能够跟踪用户位置、窃取数据或机密信息,严重威胁用户的信息安全。在移动设备与移动平台应用日益普及的今天,如何追踪各种恶意软件,保护数据不被窃取和破坏,成为移动大数据安全需要解决的重要问题。

 

网络化环境下大数据更易遭受攻击


  网络化社会的形成,为各个行业领域之间资源共享和数据互通搭建了平台和通道。一方面,基于大数据和云计算的网络化社会为大数据提供了一个开放的环境,但开放的环境必然意味着数据的暴露,使得蕴含着海量数据和潜在价值的大数据更容易遭受黑客攻击。另一方面,在开放的网络化社会,大数据的数据量巨大且相互关联,对于攻击者而言,只要付出很小的成本就可以获得极高的收益。近年来,各大电商网站频发用户账号信息失窃事件,导致用户损失重大。

 

海量非结构化数据的安全存储要求


  虽然大数据存储具有可扩展性和实用性等优点,但仍存在一些问题,例如,访问控制和隐私管理模式简单、授权与验证的安全机制薄弱、数据管理与保密手段不足等。而结构化数据的安全防护也存在漏洞,例如物理故障、人为误操作、内在BUG、病毒木马和黑客攻击等因素,都可能严重威胁数据的安全性。

 

数据生命周期的多样性变化


  传统的数据安全往往是围绕数据生命周期部署的,即数据的产生、存储、使用和销毁。随着大数据的应用越来越广泛,原来的数据生命周期逐渐转变为数据的产生、传输、存储和使用。由于大数据的规模没有上限,且许多数据的生命周期极为短暂,因此,对于大数据的安全,不能再沿用过去的生命周期模式,而需要根据大数据存储和处理的多样化、动态化和并行化特征,不断调整每个周期的数据观察边界,从而完成对数据所有操作行为的安全跟踪和管理。

 

技术的高速发展增加了安全风险


  随着网络设备和数据挖掘应用等技术的高速发展,大数据的安全风险也在不断增加。一方面,大数据本身对于安全防护重视不够,虽然各种服务组件更新速度很快,但主要是增加功能或提升性能,对于安全防护并没有给予足够的重视,一些已有的安全机制,如用户访问权限控制以及密钥管理的不足,都可能造成数据泄漏。而且大数据本身可以是一个开放性的数据载体,容易成为病毒木马的攻击对象。另一方面,发动攻击的一方,其技术水平也在快速提高,目前借助大数据分布式高并发的攻击手段开始出现,使得数据安全风险进一步加大。

 

大数据安全的应对策略


  作为大数据的管理者和使用者,需要从大数据的存储、应用和管理等方面引起重视,层层把关,全面而有针对性地应对各种数据安全问题。

 

大数据存储安全策略


  目前,大数据采用虚拟化海量存储技术来存储数据资源,涉及数据传输、隔离、恢复等问题。


  解决大数据的安全存储问题,一是通过数据加密,首先在大数据安全服务的设计中,根据数据安全存储的需求,对大数据加密后再存储,比如HBASE就提供了数据加密功能,该功能细致到能对某一列的隐私数据进行加密;其次可以通过链路加密,实现在数据集节点和应用程序之间安全地传输大数据,在传输服务过程中,为数据流的上传与下载提供有效保护;最后还可以通过内建的审计跟踪和网络数据统计分析,对可能存在的恶意用户进行识别并屏蔽。二是用户安全认证。通过对用户身份信息的管理和引入KDC这样的第三方认证服务器,对集群内部和外部的访问进行身份识别和安全认证,屏蔽非法用户的恶意访问,从而进一步提升数据的安全性。三是数据备份。通过系统容灾、定时备份、数据找回和自动健康诊断等功能,实现对大数据集群内部的数据保护,确保大数据环境一旦出现损坏,可以将影响和损失降到最低。四是使用跟踪过滤器。比如对数据流向的IP进行监控,一旦发现数据离开了允许的范围,就自动阻止数据传输。

 

大数据应用安全策略


  在大数据应用安全策略方面,需要做到以下几点:


  ●   用户访问权限控制。根据用户需求和机密等级的不同,对不同的应用或者用户设定不同的访问权限并严格控制,防止出现越权访问或误删除等威胁大数据安全的情况发生。


  ●   防止APT(高级持续性威胁)攻击。借助大数据处理技术,针对APT安全攻击隐蔽能力强、长期潜伏、攻击路径和渠道不确定等特征,设计具备实时检测能力与事后回溯能力的消息和日志审计方案,及时发现这种恶意应用程序并示警。


  ●   数据实时分析。数据实时分析就是通过对应用数据的实时分析,从大数据中快速挖掘出各类安全事件,如黑客攻击、非法访问等,然后第一时间发出警告响应。


  ●   整合梳理流程。通过对应用的工作流程进行整合梳理,防止预处理数据暴露算法或加工后数据暴露在开放环境,给恶意用户提供可乘之机。

 

大数据管理安全策略


  除通过技术手段来保护大数据的安全,管理手段也很关键。大数据的安全管理策略主要包括建立标准、建设稳定可靠的安全中心、引进先进的安全保障机制。


  大数据建设是一项有序、动态、可持续发展的系统工程,需要建立一套标准的运行机制和建设规范,保证整个大数据的运行是在一个统一的安全标准框架下开展。


  建设大数据的共享环境时,要先建立一个稳定的安全控制管理中心,对这个大数据环境进行管理,从而保障大数据安全。


  在大数据时代,技术快速发展,数据攻击手段也在不断升级换代,要不断开拓大数据安全保障机制,丰富检查手段。