《大数据时代下的数据挖掘》试题解析《海量数据挖掘技术及工程实践》题目一、单选题(共 80 题)1)( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法 的需要,并且能够得到和原始数据相同的分析结果
数据清洗8) 数据集成C
数据归约2)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购 买尿布,这种属于数据挖掘的哪类问题
(A)3) A
关联规则发现 B
聚类4) C
自然语言处理5)以下两种描述分别对应哪两种对分类算法的评价标准
(A)6) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准
7) (b)描述有多少比例的小偷给警察抓了的标准
Precision,Recall B
Recall,Precision9) A
Precision,ROC D
Recall,ROC10)将原始数据进行集成、变换、维度规约、数值规约是在以下哪 个步骤的任务
(C)11) A
频繁模式挖掘 B
分类和预测C
数据预处理D
数据流挖掘12)当不知道数据所带标签时,可以使用哪种技术促使带同类标签 的数据与带其他标签的数据相分离
(B)13) A
隐马尔可夫链14)建立一个模型,通过这个模型根据已知的变量值来预测其他某 个变量值属于数据挖掘的哪一类任务
(C)15) A
根据内容检索 B
建模描述16) C
预测建模 D
寻找模式和规则17)下面哪种不属于数据预处理的方法
(D)18) A
变量代换 B
估计遗漏值19)假设 12 个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204,215 使用如下每种方法将它们划分成四个箱
等频(等深)划分 时,15 在第几个箱子内
(B)20) A