中国矿业大学银川学院期末考试试题2010至2011学年第2学期考试科目数据仓库与数据挖掘学分2年级2008系机电动力与信息工程系专业计算机一、填空题(15分)1
数据仓库的特点分别是面向主题、集成、相对稳定、反映历史变化
元数据是描述数据仓库内数据的结构和建立方法的数据
根据元数据用途的不同可将元数据分为技术元数据和业务元数据两类
OLAP技术多维分析过程中,多维分析操作包括切片、切块、钻取、旋转等
基于依赖型数据集市和操作型数据存储的数据仓库体系结构常常被称为“中心和辐射”架构,其中企业级数据仓库是中心,源数据系统和数据集市在输入和输出范围的两端
ODS实际上是一个集成的、面向主题的、可更新的、当前值的、企业级的、详细的数据库,也叫运营数据存储
二、多项选择题(10分)6
在数据挖掘的分析方法中,直接数据挖掘包括(ACD)A分类B关联C估值D预言7
数据仓库的数据ETL过程中,ETL软件的主要功能包括(ABC)A数据抽取B数据转换C数据加载D数据稽核8
数据分类的评价准则包括(ABCD)A精确度B查全率和查准率CF-MeasureD几何均值9
层次聚类方法包括(BC)A划分聚类方法B凝聚型层次聚类方法C分解型层次聚类方法D基于密度聚类方法10
贝叶斯网络由两部分组成,分别是(AD)A网络结构B先验概率C后验概率D条件概率表三、计算题(30分)11
一个食品连锁店每周的事务记录如下表所示,其中每一条事务表示在一项收款机业务中卖出的项目,假定supmin=40%,confmin=40%,使用Apriori算法计算生成的关联规则,标明每趟数据库扫描时的候选集和大项目集
(15分)事务项目事务项目T1T2T3面包、果冻、花生酱面包、花生酱面包、牛奶、花生酱T4T5啤酒、面包啤酒、牛奶解:(1)由I={面包、果冻、花生酱、牛奶、啤酒}的所有项目直接产生1-候选C1,