1 项目背景 2
2 提出问题 2
2 数据库仓库与数据集的概念介绍 2
1 数据仓库 2
2 数据集 2
3 数据仓库 3
1 数据仓库的设计 3
1 数据仓库的概念模型设计 3
2 数据仓库的逻辑模型设计 3
2 数据仓库的建立 3
1 数据仓库数据集 3
2 建立维表 4
数据挖掘操作 4
1 数据预处理 4
1 描述性数据汇总 4
2 决策树 4
5、实验心得 1
6、大总结 1
1 项目背景在现在大数据时代,各行各业需要对商品及相关关节的数据进行收集处理,尤其零售行业,于企业对产品的市场需求进行科学合理的分析,从而预测出将来的市场,制定出高效的决策,给企业带来经济收益
2 提出问题对于超市的商品的购买时期和购买数量的如何决定,才可以使销售量最大,不积压商品,不缺货,对不同时期季节和不同人群制定不同方案,使企业收益最大,通过数据挖掘对数据进行决策树分析,关联分析,顺序分析与决策分析等可以制定出最佳方案
2 数据库仓库与数据集的概念介绍2
1 数据仓库数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合
它是单个数据存储,出于分析性报告和决策支持的目的而创建
为企业提供需要业务智能来指导业务流程改进和监视时间、成本、质量和控制
数据仓库是决策系统支持(dss)和联机分析应用数据源的结构化数据环境
数据仓库研究和解决从数据库中获取信息的问题
数据仓库的特征在于面向主题、集成性、稳定性和时变性
2 数据集数据集是指一种由数据所组成的集合
Dataset(或 dataset)是一个数据的集合,通常以表格形式出现
每一列代表一个特定变量
每一行都对应于某一成员的数据集的问题
它列出的价值观为