数据仓库与数据挖掘技术复习资料一、单项选择题1
数据挖掘技术包括三个主要的部分(C)A.数据、模型、技术B.算法、技术、领域知识C.数据、建模能力、算法与技术D.建模能力、算法与技术、领域知识2
关于基本数据的元数据是指:(D)A
基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息;B
基本元数据包括与企业相关的管理方面的数据和信息;C
基本元数据包括日志文件和简历执行处理的时序调度信息;D
基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息
关于OLAP和OLTP的说法,下列不正确的是:(A)A.OLAP事务量大,但事务内容比较简单且重复率高B.OLAP的最终数据来源与OLTP不一样C.OLTP面对的是决策人员和高层管理人员D.OLTP以应用为核心,是应用驱动的4.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务
频繁模式挖掘B
分类和预测C
数据预处理D
数据流挖掘5.下面哪种不属于数据预处理的方法
估计遗漏值6
在ID3算法中信息增益是指(D)A
信息的溢出程度B
信息的增加效益C
熵增加的程度最大D
熵减少的程度最大7
以下哪个算法是基于规则的分类器(A)A
BayesD
以下哪项关于决策树的说法是错误的(C)A.冗余属性不会对决策树的准确率造成不利的影响B.子树可能在决策树中重复多次C.决策树算法对于噪声的干扰非常敏感D.寻找最佳决策树是NP完全问题9
假设收入属性的最小与最大分别是10000和90000,现在想把当前值30000映射到区间[0,1],若采用最大-最小数据规范方法,计算结果是(A)A
在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:(D)A
有放回的简单随机抽样B