第2章数据仓库的数据存储与处理数据存储与数据处理是数据仓库系统实施的三个关键环节中的中心环节
数据存储结构设计和数据处理技术的研究在数据仓库理论中占有重要地位
第2章数据仓库的数据存储与处理2
1数据仓库的数据结构导出数据(如:数据集市)数据集市元数据调和数据(EDW&ODS)EDW元数据操作型数据(如:业务处理系统)操作型元数据企业数据模型三层数据结构2
1数据仓库的数据结构各个组成部分的含义:操作性数据:来源于业务系统中的数据
调和数据:存储在企业级数据仓库中的数据
导出数据:从数据仓库中导出并存储在各个数据集市中的数据
企业数据模型:企业组织所需数据的整体轮廓
元数据:有关数据的说明
2数据仓库的数据特征状态数据与事件数据当前数据与周期数据数据仓库中的元数据状态数据与事件数据:状态数据:描述对象状态的数据
事件数据:描述对象发生的事件的数据
数据库和数据仓库中存储的基本数据类型是状态数据
但是数据仓库中往往还存储事务或事件数据的汇总
当前数据与周期数据:当前数据(业务系统):保留的最新数据
周期数据(数据仓库):保留的历史数据
数据仓库中的元数据:数据仓库中的另一特征
3数据仓库的数据ETL过程ETL概念ETL过程前后数据的特征数据的ETL过程描述抽取(Capture/Extract)清洗(Scrub/Cleanse)转换(Transform)加载和索引(Load/Index)ETL的概念:数据ETL是用来实现异构数据源的数据集成,即完成数据的抓取/抽取(Capture/Extract)、清洗(Scrubordatacleansing)、转换(Transform)、装载与索引(LoadandIndex)等数据调和工作
数据的ETL过程描述:操作型系统EDW或ODS抽取/抓取清洗转换加载与索引拒绝数据的信息有关拒