数据仓库与数据挖掘习题答案第 1 章 数据仓库的概念与体系结构1
面向主题的, 相对稳定的
技术元数据, 业务元数据
联机分析处理OLAP
切片( Slice),钻取( Drill-down和 Roll-up 等)
基于关系数据库
数据抽取,数据存储与管理
两层架构,独立型数据集市,依赖型数据集市和操作型数据存储,逻辑型数据集市和实时数据仓库
可更新的,当前值的
以报表为主,以分析为主,以预测模型为主,以营运导向为主
答:数据仓库就是一个面向主题的(Subject Oriented)、集成的( Integrate)、相对稳定的(Non-Volatile )、反映历史变化(Time Variant)的数据集合,通常用于辅助决策支持
数据仓库的特点包含以下几个方面:(1) 面向主题
操作型数据库的数据组织是面向事务处理任务,各个业务系统之间各自分离;而数据仓库中的数据是按照一定的主题域进行组织
主题是一个抽象的概念, 是指用户使用数据仓库进行决策时所关心的重点领域,一个主题通常与多个操作型业务系统或外部档案数据相关
(2)集成的
面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的
而数据仓库中的数据是在对原有分散的数据库数据作抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企事业单位一致的全局信息
也就是说存放在数据仓库中的数据应使用一致的命名规则、格式、编码结构和相关特性来定义
(3)相对稳定的
操作型数据库中的数据通常实时更新,数据根据需要及时发生变化
数据仓库的数据主要供单位决策分析之用,对所涉及的数据操作主要是数据查询和加载,一旦某个数据加载到数据仓库以后,一般情况下将作为数据档案长期保存,几乎