基于大数据的线上线下电商用户数据挖掘研究数据分析微信公众号datadw——关注你想了解的,分享你需要的。Online-to-Offline(简称O2O)电子商务模式,是一个连接线上用户和线下商家的多边平台商业模式。O2O商业模式将实体经济与线上资源融合在一起,使网络成为实体经济延伸到虚拟世界的渠道;线下商业可以到线上挖掘和吸引客源,而消费者可以在线上筛选商品和服务并完成支付,再到实体店完成余下消费。它最先由TrialPay创始人AlexRampell提出,在2006年沃尔玛公司的B2C战略中予以应用,随后以网络团购形式为大家所熟知。目前O2O电子商务与社交网络和移动终端紧密结合,除网络团购之外,还出现了移动优惠、签到、个性推荐等基于位置的增值服务等商业形态;从事O2O电商的企业更是数以万计,除了Foursquare、大众点评网、拉手网等后起之秀外,还不乏FaceBook、Twitter、腾讯和百度等业界巨鳄也在迅猛跟进;O2O电商交易额也迅速放大,2011年大众点评网营业额已破10亿元;与交易猛增随之而来的是爆发式增长的O2O电商数据,大众点评网目前每天的活跃数据量已经超过10TB,共有240万商家信息和5500万活跃用户在上面活动,每天发表点评超过80万条,每日点评浏览量超过4700万人次。用户数据的暴增与数据的社会化在很大程度上模糊了O2O电商企业数据的边界,这些由用户创造的海量数据远远超越了目前人力所能处理的范畴。庞大的数据量使得数据过载、数据冗余、数据捕获成本快速增长、数据价值不易获得成为O2O电子商务面临的新问题。根据相关统计显示,如今世界已经进入到大数据时代,电子商务中用户数据每年增长约60%,企业平均捕获其中的25%~30%,但数据的利用一般不足其5%,用户数据作为O2O电商核心资源的商业价值远未被挖掘。基于此,本文对“大数据”环境下O2O用户数据挖掘以及应用进行了分析。1大数据环境下O2O电子商务用户数据特征分析相比传统的电子商务数据,O2O用户数据并不仅仅局限于平台数据,即用户在O2O的交易数据,还包括了社交网络、用户移动终端的地理位置等数据。也就是说,O2O电子商务用户数据为在O2O电商日常经营中产生和积累的与用户相关的交易、互动、观测数据。O2O用户数据具有大数据的特征。(1)体量大。不少的O2O电商企业每日所产生的用户数据已经达到TB级。在融入了社交网络和移动互联网的O2O电子商务中,O2O用户数据已不仅仅是用户交易数据,它拥有更加广泛的数据源,其数据规模会从TB级跃升到PB甚至是EB级。未来企业会将更多的TB级数据应用于商务智能和商务分析。(2)类型多。O2O用户数据类型复杂。它并不仅限于O2O用户基本资料、用户消费记录、电商企业内部业务信息等海量的结构化和半结构化数据,还包括用户评论等反馈数据、用户O2O平台行为记录、移动终端数据和社交媒体等非结构数据。(3)速率快。O2O模式对用户数据实时处理有着极高的要求:用户数据伴随用户行为产生,这些数据往往是高速实时数据流,例如用户在线下商家的消费情况用户的地理位置和移动方向等,而且O2O业务周期短,这需要实时的分析用户数据并根据分析结果对用户进行个性化服务,通过传统的数据库查询方式得到的“当前结果”很可能已经没有价值。(4)价值高。O2O用户数据有着巨大的商业价值。用户是O2O业务的核心,对用户进行预测分析与深度复杂分析,对O2O电商企业无疑有着重大的价值,但庞大而繁杂的不相关用户数据,这也决定了其价值密度低的特性。2大数据环境下O2O电商用户数据挖掘流程与方法2.1、O2O电商用户数据挖掘框架由于O2O商用户数据的4V大数据特征,电商企业并不能运用传统数据分析技术对其进行很好的利用。传统数据分析与大数据挖掘都是从数据中提取有用信息、发现知识,是对数据进行深入分析和增值开发利用的过程,但是它们之间有着本质区别,主要体现在:1)两者分析的数据规模不同,传统数据分析处理的通常是存储在数据库或者文件中的数据,数据规模一般是GB级以下,而大数据挖掘中的数据规模一般是PB级甚至更大量级;2)两者分析的数据类型不同,传统数据分析主要针对静态的、结构化的数据,而大数据挖掘的对象不仅仅是结构化数据,还包括半结构化、非结构化数据,很多时候是以...