1/11一、填空题(2×10=20分)1、数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合
2、元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据数据用途的不同可将数据仓库的元数据分为技术元数据和业务元数据两类
3、数据处理通常分成两大类:联机事务处理和联机分析处理
4、ROLAP是基于关系数据库的OLAP实现,而MOLAP是基于多维数据结构组织的OLAP实现
5、调和数据是存储在企业级数据仓库和操作型数据存储中的数据
6、数据抽取的两个常见类型是静态抽取和增量抽取
静态抽取用于最初填充数据仓库,增量抽取用于进行数据仓库的维护
7、维度表一般由主键、分类层次和描述属性组成
对于主键可以选择两种方式:一种是采用自然键,另一种是采用代理键
7、雪花型模式是对星型模式维表的进一步层次化和规范化来消除冗余的数据
8、数据仓库中存在不同综合级别的数据
一般把数据分成4个级别:早期细节级、当前细节级、轻度综合级和高度综合级
9、数据仓库的概念模型通常采用信息包图法来进行设计,要求将其5个组成部分(包括名称、维度、类别、层次和度量)全面地描述出来
10、确定了数据仓库的粒度模型以后,为提高数据仓库的使用性能,还需要根据用户需求设计聚合模型
11、粒度是对数据仓库中数据的综合程度高低的一个衡量
粒度越小,细节程度越高,综合程度越低,回答查询的种类越多
12、数据仓库的数据量通常较大,且数据一般很少更新,可以通过设计和优化索引结构来提高数据存取性能
13、聚类分析包括连续型、二值离散型、多值离散型和混合类型4种类型描述属性的相似度计算方法
14、OLAP的实现方式有以下两种:基于关系数据库系统的实现和基于多维数据库系统的实现
2/1115、数据仓库的逻辑模型通常采用星型图法来进行设计,要求将星型的各类逻辑实体完整地描述出来