电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

原《数据挖掘》习题

原《数据挖掘》习题_第1页
1/20
原《数据挖掘》习题_第2页
2/20
原《数据挖掘》习题_第3页
3/20
ch1 1. 讨论下列每项活动是否是数据挖掘任务:( fgh 是) (a) 根据性别划分公司的顾客。 (b) 根据可赢利性划分公司的顾客。 (c) 计算公司的总销售额。 (d) 按学生的标识号对学生数据库排序。 (e) 预测掷一对骰子的结果。 (f) 使用历史记录预测某公司未来的股票价格。 (g) 监视病人心率的异常变化。 (h) 监视地震活动的地震波。 (i) 提取声波的频率。 2. ( ch1) 数据挖掘可以在很多数据源上进行,如关系数据库,空间数据库,多媒体数据库,文本数据库等。 3. (ch1) 数据挖掘一定可以得到有趣的强关联规则。 4. ( ch1) 为了提高挖掘质量,通常要进行数据预处理,包括数据清理、集成、选择、变换等。 5. (ch5){ 发烧,上呼吸道感染} 是(2)项集 6.企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是( B )。 A 数据越多越好 B 尽可能多的适合的数据 C 数据越少越好 D 以上三条都正确 7. 数据挖掘算法以( D )形式来组织数据。 A 行 B 列 C 记录 D 表格 Ch2 8. ( ch2) 假定用于分析的数据包含属性age。数据元组中age 的值如下(按递增序): 13, 15, 16, 16, 19, 20, 20, 21, 22,22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36,40, 45, 46, 52, 70,求: 1)使用按箱平均值平滑对以上数据进行平滑,箱的深度是3。解释你的步骤。 2)使用按箱边界值平滑对以上数据进行平滑,箱的深度是3。解释你的步骤。 7、 P98 3.4( ch3) 假定大学的数据仓库包含4 个维{student 学生、course 课程、semester 学期、instructor 教师},2 个度量count 和 avg_grade。在最低的概念层(例如对于给定的学生、课程、学期和教师组合),度量avg_grade 存放学生的实际成绩。为数据仓库画出雪花模式图 8、 P98 3.5( ch3) 假定数据仓库包含4 个维date,spectator,location 和game, 2 个度量count 和charge。其中,change 是观众在给定的日期观看节目的付费。观众可以是学生、成年人或老人,每类观众有不同的收费标准。画出该数据仓库的星形模式图 10、(ch5) 数据库有 4 个事物。设 min_sup=60%,min_conf=80% TID 日期 购买的物品 T100 99/10/15 {K,A,D,B} T200 99/10/15 {D,A,C,E,B} T300 99/10/19 {C,A,B,E} T400 99/10/22 {B,A,D} a)使用 Apriori 算法找出...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

原《数据挖掘》习题

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部