数据挖掘考试-内部选拔考题 一、单选题(每题 0
5 分,共 3 0 题) 1
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题
关联规则发现 B
自然语言处理 2
将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务
频繁模式挖掘 B
分类和预测 C
数据预处理 D
数据流挖掘 3
当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离
关联分析 D
隐马尔可夫链 4
使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务
探索性数据分析 B
建模描述 C
预测建模 D
寻找模式和规则 5
下面哪种不属于数据预处理的方法
(D) A 变量代换 B 离散化 C 聚集 D 估计遗漏值 6
假设 12 个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱
等频(等深)划分时,15 在第几个箱子内
(B) A 第一个 B 第二个 C 第三个 D 第四个 7
只有非零值才重要的二元属性被称作:( C ) A 计数属性 B 离散属性 C 非对称的二元属性 D 对称属性 8
以下哪种方法不属于特征选择的标准方法: (D) A 嵌入 B 过滤 C 包装 D 抽样 9
下面不属于创建新属性的相关方法的是: (B) A 特征提取 B 特征修改 C 映射数据到新的空间 D 特征构造 10
假设属性 income 的最大最小值分别是 12000 元和 98000 元
利用最大最小规范化的方法将属性的值映射到 0 至 1 的范围内
对属性 income 的