ch1 1. 讨论下列每项活动是否是数据挖掘任务:( fgh 是) (a) 根据性别划分公司的顾客。 (b) 根据可赢利性划分公司的顾客。 (c) 计算公司的总销售额。 (d) 按学生的标识号对学生数据库排序。 (e) 预测掷一对骰子的结果。 (f) 使用历史记录预测某公司未来的股票价格。 (g) 监视病人心率的异常变化。 (h) 监视地震活动的地震波。 (i) 提取声波的频率。 2. ( ch1) 数据挖掘可以在很多数据源上进行,如关系数据库,空间数据库,多媒体数据库,文本数据库等。 3. (ch1) 数据挖掘一定可以得到有趣的强关联规则。 4. ( ch1) 为了提高挖掘质量,通常要进行数据预处理,包括数据清理、集成、选择、变换等。 5. (ch5){ 发烧,上呼吸道感染} 是(2)项集 6.企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是( B )。 A 数据越多越好 B 尽可能多的适合的数据 C 数据越少越好 D 以上三条都正确 7. 数据挖掘算法以( D )形式来组织数据。 A 行 B 列 C 记录 D 表格 Ch2 8. ( ch2) 假定用于分析的数据包含属性age。数据元组中age 的值如下(按递增序): 13, 15, 16, 16, 19, 20, 20, 21, 22,22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36,40, 45, 46, 52, 70,求: 1)使用按箱平均值平滑对以上数据进行平滑,箱的深度是3。解释你的步骤。 2)使用按箱边界值平滑对以上数据进行平滑,箱的深度是3。解释你的步骤。 7、 P98 3.4( ch3) 假定大学的数据仓库包含4 个维{student 学生、course 课程、semester 学期、instructor 教师},2 个度量count 和 avg_grade。在最低的概念层(例如对于给定的学生、课程、学期和教师组合),度量avg_grade 存放学生的实际成绩。为数据仓库画出雪花模式图 8、 P98 3.5( ch3) 假定数据仓库包含4 个维date,spectator,location 和game, 2 个度量count 和charge。其中,change 是观众在给定的日期观看节目的付费。观众可以是学生、成年人或老人,每类观众有不同的收费标准。画出该数据仓库的星形模式图 10、(ch5) 数据库有 4 个事物。设 min_sup=60%,min_conf=80% TID 日期 购买的物品 T100 99/10/15 {K,A,D,B} T200 99/10/15 {D,A,C,E,B} T300 99/10/19 {C,A,B,E} T400 99/10/22 {B,A,D} a)使用 Apriori 算法找出...