电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

数据仓库与数据挖掘实验一(数据仓库的构建)VIP免费

数据仓库与数据挖掘实验一(数据仓库的构建)_第1页
1/9
数据仓库与数据挖掘实验一(数据仓库的构建)_第2页
2/9
数据仓库与数据挖掘实验一(数据仓库的构建)_第3页
3/9
-1- 一、实验内容和目的 目的: 1.理解数据库与数据仓库之间的区别与联系; 2.掌握典型的关系型数据库及其数据仓库系统的工作原理以及应用方法; 3.掌握数据仓库建立的基本方法及其相关工具的使用。 内容: 以 SQL Server 为系统平台,设计、建立数据库,并以此为基础创建数据仓库。 二、所用仪器、材料(设备名称、型号、规格等) 操作系统平台:Windows 7 数据库平台:SQL Server 2008 SP2 三、实验原理 数据仓库是在原有关系型数据库基础上发展形成的,但不同于数据库系统的组织结构形式,它从原有的业务数据库中获得的数据形成当前基本数据层,经过综合后形成轻度综合数据层,轻度综合数据再经过综合后形成高度综合数据层。数据仓库结构包括当前基本数据(current detail data)、历史基本数据(older detail data)、轻度综合数据(lightly summarized data)、高度综合数据(highly summarized data)和元数据(meta data)。 数据仓库系统由数据仓库、仓库管理和分析工具 3 部分组成,结构形式如下图所示: 关系数据库 数据文件 其他数据 数据建模 抽取、转换 装载(ETL) 元数据 系统管理 综合数据 当前数据 历史数据 查询工具 OLAP 工具 DM 工具 C/S 工具 -2- 数据仓库的逻辑数据模型是多维结构的数据视图,也称多维数据模型。对于逻辑数据模型,可以使用不同的存储机制和表示模式来实现多维数据模型。目前使用的多维数据模型主要有星型模型、雪花模型、星网模型、第三范式等。 ETL 过程在开发数据仓库时,占去 70%的工作量。ETL 过程的主要步骤概括为: (1) 决定数据仓库中需要的所有的目标数据; (2) 决定所有的数据源,包括内部和外部的数据源; (3) 准备从源数据到目标数据的数据映射关系; (4) 建立全面的数据抽取规则; (5) 决定数据转换和清洗规则; (6) 为综合表制定计划; (7) 组织数据缓冲区域和检测工具; (8) 为所有的数据装载编写规程; (9) 维度表的抽取、转换和装载; (10) 事实表的抽取、转换和装载。 四、实验方法、步骤 要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验项目,真实地记录实验中遇到的各种问题和解决的方法与过程,并绘出模拟实验案例的数据仓库模型。实验完成后,应根据实验情况写出实验报告。 五、实验过程原始记录(数据、图表、计算等) 本次实验使用Microsoft SQL Serv er...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

数据仓库与数据挖掘实验一(数据仓库的构建)

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部