电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

数据挖掘期末复习资料VIP免费

数据挖掘期末复习资料_第1页
1/8
数据挖掘期末复习资料_第2页
2/8
数据挖掘期末复习资料_第3页
3/8
数据挖掘期末复习资料 2009-02-21 20:38:37| 分类: 读书笔记 | 标签: |字号大中小 订阅 题型:填空(20 空)、判断(20 分)、简答(5 个:预处理方法、决策树、朴素贝叶斯过程、其他一些知识内容)、大题(算法:关联分析、分类、决策树、ID3 算法、贝叶斯方法、A神经网络、聚类回归占得比较小) 概述 一、数据挖掘是一个多学科领域,具体涉及到哪些相关学科?数据库及相关领域知识。 二、什么是数据挖掘,产生的背景,典型的数据挖掘系统的主要成分? 数据挖掘定义:数据挖掘是从存放在数据库,数据仓库或其他信息库中的大量数据中挖掘有趣知识的过程。 典型的数据挖掘系统的主要成分:1.数据库,数据仓库或其他信息库;2.数据库或数据仓库服务器:3.知识库;4.数据挖掘引擎;5.模式评估模块;6.图形用户界面。 三、数据挖掘的功能有哪些? 数据挖掘功能-可以挖掘什么类型的模式。数据挖掘任务:描述和预测。 描述性挖掘任务刻划数据库中数据的一般特性;预测性挖掘任务在当前数据上进行推断。 数据挖掘的功能——用于指定数据挖掘任务中要找的模式类型。其模式类型介绍如下: (1)、概念/类描述:特征化和区分。用汇总的、简洁的、精确的方式描述每个类和概念,称这种描述为类/概念描述,通过三种方式得到:1)数据特征化 2)数据区分 3)数据特征化和比较。 (2)关联分析:发现规则,这些规则展示属性-值频繁地在给定数据集中一起出现的条件。 关联规则的含义为:满足 X 中条件的数据库元组多半也满足 Y 中条件。包括多维关联规则和单维关联规则。 (3)分类和预测:分类与预测是两种数据分析形式,它们可用于抽取能够描述重要数据集合或预测未来数据趋势的模型。分类是找出描述并区分数据类或概念的模型或函数,以便能用模型预测类标记未知的对象类。如:可以构造一个分类模型来对银行贷款进行风险评估(安全或危险);也可建立一个预测模型以利用顾客收入与职业(参数)预测其可能用于购买计算机设备的支出大小。 (4)聚类分析:它考虑的是数据对象,将数据对象根据一定的规则比如,最大化类内的相似性,最小化类间的相似性进行分组或聚类。同类相聚,异类相离 (5)孤立点分析:有些对象与数据的一般行为或模式不一致,称这些数据对象是孤立点。 (6)演变分析(时序分析):描述行为随时间变化的数据对象的规律或趋势,并对其建模,比如,股票的演变规律。 四、数据挖掘的性能问题包括哪 3 个方面? 五、...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

数据挖掘期末复习资料

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部