数据挖掘实验指导书VIP免费

下载本文档

阅读 105
下载 29
格式 doc
大小 187 KB
约20页
2024-11-12 发布于河南
收藏
评论
点赞(0)
海报
举报

1/20页

2/20页

3/20页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/20

文本预览下载提示常见问题

《数据挖掘》实验指导书2011年3月1日长沙学院信息与计算科学系前言随着数据库技术的发展，特别是数据仓库以及Web等新型数据源的日益普及，形成了数据丰富，知识缺乏的严重局面。针对如何有效地利用这些海量的数据信息的挑战，数据挖掘技术应运而生，并显示出强大的生命力。数据挖掘技术使数据处理技术进入了一个更高级的阶段，是对未来人类产生重大影响的十大新兴技术之一。因此加强数据挖掘领域的理论与实践学习也已成为专业学生的必修内容。本实验指导书通过大量的实例，循序渐进地引导学生做好各章的实验。根据实验教学大纲，我们编排了五个实验，每个实验又分了五部分内容：实验目的、实验内容、实验步骤、实验报告要求、注意事项。在实验之前，由教师对实验作一定的讲解后，让学生明确实验目的，并对实验作好预习工作。在实验中，学生根据实验指导中的内容进行验证与总结，然后再去完成实验步骤中安排的任务。实验完成后，学生按要求完成实验报告。整个教学和实验中，我们强调学生切实培养动手实践能力，掌握数据挖掘的基本方法。长沙学院信息与计算科学系数据挖掘实验指导书实验一K-Means聚类算法实现一、实验目的通过分析K-Means聚类算法的聚类原理，利用Vc编程工具编程实现K-Means聚类算法，并通过对样本数据的聚类过程，加深对该聚类算法的理解与应用过程。实验类型：验证计划课间：4学时二、实验内容1、分析K-Means聚类算法；2、分析距离计算方法；3、分析聚类的评价准则；4、编程完成K-Means聚类算法，并基于相关实验数据实现聚类过程；三、实验方法1、K-means聚类算法原理K-means聚类算法以k为参数，把n个对象分为k个簇，以使簇内的具有较高的相似度。相似度的计算根据一个簇中对象的平均值来进行。算法描述：输入：簇的数目k和包含n个对象的数据库输出：使平方误差准则最小的k个簇过程：任选k个对象作为初始的簇中心；Repeatforj=1tonDO根据簇中对象的平均值，将每个对象赋给最类似的簇fori=1tokDO更新簇的平均值计算EUnitlE不再发生变化按簇输出相应的对象2、聚类评价准则：E的计算为：第3页长沙学院信息与计算科学系数据挖掘实验指导书四、实验步骤4.1实验数据P192：154.2初始簇中心的选择选择k个样本作为簇中心For(i=0;i

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

数据挖掘实验指导书

《数据挖掘》实验指导书2011年3月1日长沙学院信息与计算科学系前言随着数据库技术的发展，特别是数据仓库以及Web等新型数据源的日益普及，形成了数据丰富，知识缺乏的严重局面

针对如何有效地利用这些海量的数据信息的挑战，数据挖掘技术应运而生，并显示出强大的生命力

数据挖掘技术使数据处理技术进入了一个更高级的阶段，是对未来人类产生重大影响的十大新兴技术之一

因此加强数据挖掘领域的理论与实践学习也已成为专业学生的必修内容

本实验指导书通过大量的实例，循序渐进地引导学生做好各章的实验

根据实验教学大纲，我们编排了五个实验，每个实验又分了五部分内容：实验目的、实验内容、实验步骤、实验报告要求、注意事项

在实验之前，由教师对实验作一定的讲解后，让学生明确实验目的，并对实验作好预习工作

在实验中，学生根据实验指导中的内容进行验证与总结，然后再去完成实验步骤中安排的任务

实验完成后，学生按要求完成实验报告

整个教学和实验中，我们强调学生切实培养动手实践能力，掌握数据挖掘的基本方法

长沙学院信息与计算科学系数据挖掘实验指导书实验一K-Means聚类算法实现一、实验目的通过分析K-Means聚类算法的聚类原理，利用Vc编程工具编程实现K-Means聚类算法，并通过对样本数据的聚类过程，加深对该聚类算法的理解与应用过程

实验类型：验证计划课间：4学时二、实验内容1、分析K-Means聚类算法；2、分析距离计算方法；3、分析聚类的评价准则；4、编程完成K-Means聚类算法，并基于相关实验数据实现聚类过程；三、实验方法1、K-means聚类算法原理K-means聚类算法以k为参数，把n个对象分为k个簇，以使簇内的具有较高的相似度

相似度的计算根据一个簇中对象的平均值来进行

算法描述：输入：簇的数目k和包含n个对象的数据库输出：使平方误差准则最小的k个簇过程：任选k个对象作为初始的簇中心；Repea

书海行舟 + 关注: 实名认证
内容提供者

热爱教学事业，对互联网知识分享很感兴趣

收藏店铺进入空间

数据挖掘实验指导书VIP免费

数据挖掘实验指导书

您可能关注的文档

相关文档

热门下载

相关标签