电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

用MATLAB实现数据挖掘的一种算法

用MATLAB实现数据挖掘的一种算法_第1页
1/16
用MATLAB实现数据挖掘的一种算法_第2页
2/16
用MATLAB实现数据挖掘的一种算法_第3页
3/16
一、数据挖掘的目的 数据挖掘(Data Mining)阶段首先要确定挖掘的任务或目的。数据挖掘的目的就是得出隐藏在数据中的有价值的信息。数据挖掘是一门涉及面很广的交叉学科,包括器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。它也常被称为“知识发现”。知识发现(KDD)被认为是从数据中发现有用知识的整个过程。数据挖掘被认为是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式(patter,如数据分类、聚类、关联规则发现或序列模式发现等。数据挖掘主要步骤是:数据准备、数据挖掘、结果的解释评估。 二、数据挖掘算法说明 确定了挖掘任务后,就要决定使用什么样的挖掘算法。由于条件属性在各样本的分布特性和所反映的主观特性的不同, 每一个样本对应于真实情况的局部映射。建立了粗糙集理论中样本知识与信息之间的对应表示关系, 给出了由属性约简 求 约简 决策 表的方 法。基 于后离 散 化 策 略 处 理连 续 属性, 实现离 散 效 率 和信息损 失 之间的动 态 折 衷 。提 出相对值条件互 信息的概 念 衡 量 单 一样本中各条件属性的相关性, 可 以 充 分利 用现有数据处 理不完 备信息系统。 本次 数据挖掘的方 法是两 种 ,一是找 到 若 干 条特殊 样本,而 是找 出若 干 条特殊 条件属性。最 后利 用这 些 样本和属性找 出关联规则。( 第 四 部分详 细 讲 解样本和属性的选 择 ) 三 数据预 处 理过程 数据预 处 理一般 包括消 除 噪 声 、推 导 计算缺 值数据、消 除 重 复 记 录 、完 成 数据类型 转 换 (如把 连 续 值数据转 换 为离 散 型 数据,以 便 于符 号 归 纳 ,或是把 离 散型 数据转 换 为连 续 )。 本文 使用的数据来 源 是名 为“Cardiology Categorical”的ex cel文 件中的“源 数据”。该 数据表共 303行 ,14个属性。即 共 有303个样本。将 该 数据表的前 200行 设为训 练 样本,剩 下 后的103行 作 为测 试 样本,用基 于粗糙集理论的属性约简 的方法生 成 相应的规则,再 利 用测 试 样本对这 些 规则进 行 测 试 。 首先对源 数据进 行 预 处 理,主要包括字 符 型 数据的转 化 和数据的归 一化 。 数据预 处 理的第 一步是整理源 数据,为了便 于 matlab 读 取数据,把 非 数字数据转 换 ...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

用MATLAB实现数据挖掘的一种算法

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部