讨论下列每项活动是否是数据挖掘任务:( fgh 是) (a) 根据性别划分公司的顾客
(b) 根据可赢利性划分公司的顾客
(c) 计算公司的总销售额
(d) 按学生的标识号对学生数据库排序
(e) 预测掷一对骰子的结果
(f) 使用历史记录预测某公司未来的股票价格
(g) 监视病人心率的异常变化
(h) 监视地震活动的地震波
(i) 提取声波的频率
( ch1) 数据挖掘可以在很多数据源上进行,如关系数据库,空间数据库,多媒体数据库,文本数据库等
(ch1) 数据挖掘一定可以得到有趣的强关联规则
( ch1) 为了提高挖掘质量,通常要进行数据预处理,包括数据清理、集成、选择、变换等
(ch5){ 发烧,上呼吸道感染} 是(2)项集 6
企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是( B )
A 数据越多越好 B 尽可能多的适合的数据 C 数据越少越好 D 以上三条都正确 7
数据挖掘算法以( D )形式来组织数据
A 行 B 列 C 记录 D 表格 Ch2 8
( ch2) 假定用于分析的数据包含属性age
数据元组中age 的值如下(按递增序): 13, 15, 16, 16, 19, 20, 20, 21, 22,22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36,40, 45, 46, 52, 70,求: 1)使用按箱平均值平滑对以上数据进行平滑,箱的深度是3
解释你的步骤
2)使用按箱边界值平滑对以上数据进行平滑,箱的深度是3
解释你的步骤
7、 P98 3
4( ch3) 假定大学的数据仓库包含4 个维{student 学生、course 课程、semester 学期、instructor 教师},2 个度量count