随着计算机技术和网络的不断发展,业务数据持续快速增长。IDC公司的研究结果表明,2011年全球产生的数据量高达1.82ZB,相当于全球每人产生200GB以上的数据;而未来几年全球数据量将以40+%的速度增长,2020年全球数据量将达到35ZB。大数据时代已经到来。数据正日益凸显其价值,成为企业的重要资产。
Gartner公司认为:大数据是大量、高速、多变的信息,它需要新型的处理方式去促成更强的决策能力、洞察力与最佳化处理。大数据为企业获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。
大数据加深对客户行为的洞察
在精准营销理论中,客户洞察是精准营销的第一步。企业从大规模制造过渡到大规模定制,必须掌握用户的需求特点。基于通信行为、上网数据等,可以对客户行为特征进行洞察。这些特征往往是在用户不经意的行为中透露出来的,通过对信息进行关联、参照、聚类、分类等方法分析,得到有价值的用户行为洞察。
可通过兴趣点机制,作为客户洞察的基础。兴趣点的初始化建立,可以通过收集和整理开放式分类目录、各大行业主流网站、热门门户网站以及参考互联网分类行业标准来制定。同时需建立兴趣点调整的动态机制。
对于给用户打上兴趣点标签,其难点一是要保证能正确理解用户的上网行为,恰当地描述用户上网行为,其难点二是要在用户的即兴上网行为与上网嗜好之间取得平衡。
基于用户上网次数、流量、时间段等属性,可以给用户打上合理的兴趣点标签;针对较少上网的用户,可以通过已经标记标签用户的基础数据特征(如年龄、性别、流量、终端等基础资料),使用数据挖掘工具和方法,利用历史数据生成用户基础数据特征与偏好的对应关系的模型,来近似预测其偏好标签。针对用户上网的不同风格,可把用户的偏好分为即时偏好、天、周、月、年,以应对即时营销等不同的营销需要。
大数据需要新技术支撑
大数据也带来了严峻的挑战。信息化技术的普及使得企业更多的办公流程通过网络实现,由此产生的数据以结构化数据为主。当前数据创造的主体由企业逐渐转向个体,而个体所产生的绝大部分数据为图片、文档、视频等非结构化数据。同时,在线个性化推荐、实时信息推送等数据处理时间要求在分钟甚至秒级,传统的数据仓库系统、数据挖掘等应用无法处理非结构化数据,也不能满足数据处理的实时性。
大数据与传统数据两者数据量的差别如此之大,决定了数据的存储、计算从架构上很不一样。常规的数据仓库技术仍然有用武之地,但更适合大数据的,有大规模并行处理(MPP)、分布式处理等技术。结合当前技术发展状态,从性能、并行计算能力、可扩展性、软件的成本、硬件的投资等方面综合分析之后,为满足结构化与非结构化数据存储与处理,建议采用RDBMS+ Hadoop混搭方式,并引入流计算技术。
Hadoop平台的分布式存储的特点,可以把数据存储在多个节点上,能够处理PB级数据。Hadoop能够在节点之间动态地移动数据,并保证各节点的动态平衡,利用其MapReduce的并行处理能力,处理速度非常快。非结构化数据在Hadoop平台上存储与处理;大数据量计算在Hadoop平台上处理;结构化,不需要关联分析、查询较少的数据,保存在Hadoop平台;结构化、需要关联分析或经常查询的生产、汇总数据保存在关系型数据库中。
流计算不同于文件批处理的方式,是一个事件触发的数据处理机制,能够保证其数据的实时性。经测试,中兴软创所掌握的流计算技术在一台普通PC Server上,可以达到20MB/s的处理效率;并且支持线性扩展,能够满足电信行业处理需要。
应用场景分析
目前大部分企业面临的挑战不是缺少数据,而是数据太多。通过新型技术,大数据价值可能被充分地挖掘和利用。大数据要发挥价值,必须与业务融合,能够带来实际业务收益。大数据的应用模式仍处于探索阶段。
应用场景一:实时热点内容偏好推荐
图1中描述了如何将互联网热点内容推荐给潜在访问者,以提升流量提升的整个业务处理流程。
● 系统自动检测主流网站和搜索引擎,通过网络爬虫获取热点内容;
● 根据热点内容与客户偏好的对应关系,自动获取待推送的目标用户,目标用户要求为未访问过该热点的用户;
● 人工审核后,实现热点内容推送。
应用场景二:位置触发的营销
基于位置触发的营销方式,当客户进入商圈范围时,如果属于目标客户,将实时接收到营销信息。
● 商圈定义:对基站覆盖范围进行维护,并对商圈位置范围进行定义,建立多维度商圈类型,包括购物、餐饮等,同时建立位置信息库;
● 业务定义:对触发区域、触发规则、营销内容进行配置,并规定推送信息的时效性;
● 当客户位置处于商圈内,满足触发条件时实时触发;
● 信息推送,将相关活动信息推送给目标客户,如:亲,XX商场的XX专柜现正在进行酬宾活动,您凭此二维码即可享受7折优惠。
其他应用场景
在电信行业还可探索以下应用场景。
● 业务投放:根据订购或使用产品、业务的用户特点,筛选目标用户,对自有产品、业务做针对性营销推荐;
● 终端营销:分析用户换终端的特点,进行终端的精确化营销;
● 即时营销:基于用户的上网时机、上网位置做精确化的营销;
● 关联产品推荐:基于产品关联销售的特点和用户订购产品的历史信息,做关联产品的推荐。
重庆电信大数据试点项目移动互联网客户行为分析工程已正式商用,正在积极探索大数据场景应用。
结语
借助大数据及相关技术,我们可针对不同行为特征的客户进行针对性营销,甚至能从“将一个产品推荐给一些合适的客户”到“将一些合适的产品推荐给一个客户”,得以更聚焦客户,进行个性化精准营销。
虽然大数据应用尚在探索,还存在客户隐私保护权衡等问题,但正如哈佛大学教授加里 金所说:这是伟大社会变革的一部分,无论学术界、工商界还是政府,所有领域都将开始这种量化进程。