大数据数据挖掘案例篇一:大数据数据挖掘案例】本文为系列文,该篇为第一篇
下面是正文:简而言之,数据挖掘(datamining)是有组织有目的地收集数据,通过分析数据使之成为信息,从而在大量数据中寻找潜在规律以形成规则或知识的技术
在本文中,我们从数据挖掘的实例出发,并以数据挖掘中比较经典的分类算法入手,给读者介绍我们怎样利用数据挖掘的技术解决现实中出现的问题
数据挖掘是如何解决问题的
本节通过几个数据挖掘实际案例来诠释如何通过数据挖掘解决商业中遇到的问题
下面关于“啤酒和尿不湿”的故事是数据挖掘中最经典的案例
而target公司通过“怀孕预测指数”来预测女顾客是否怀孕的案例也是近来为数据挖掘学者最津津乐道的一个话题
尿不湿和啤酒很多人会问,究竟数据挖掘能够为企业做些什么
下面我们通过一个在数据挖掘中最经典的案例来解释这个问题——一个关于尿不湿与啤酒的故事
超级商业零售连锁巨无霸沃尔玛公司(walmart)拥有世上最大的数据仓库系统之一
为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行了购物篮关联规则分析,从而知道顾客经常一起购买的商品有哪些
在沃尔玛庞大的数据仓库里集合了其所有门店的详细原始交易数据,在这些原始交易数据的基础上,沃尔玛利用数据挖掘工具对这些数据进行分析和挖掘
一个令人惊奇和意外的结果出现了:“跟尿不湿一起购买最多的商品竟是啤酒”
这是数据挖掘技术对历史数据进行分析的结果,反映的是数据的内在规律
那么这个结果符合现实情况吗
是否是一个有用的知识
是否有利用价值
为了验证这一结果,沃尔玛派出市场调查人员和分析师对这一结果进行调查分析
经过大量实际调查和分析,他们揭示了一个隐藏在“尿不湿与啤酒”背后的美国消费者的一种行为模式:在美国,到超市去买婴儿尿不湿是一些年轻的父亲下班后的日常工作,而他们中有30%〜40%的人同时也会为自己买一些啤酒