大数据理论与技术读书报告-----K 最近邻分类算法指导老师: 陈 莉学生姓名: 李阳帆学号 : 201531467 专业 : 计算机技术日期 :2016 年 8 月 31 日摘要数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合, 让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不同应用的需要。K 近邻算法( KNN )是基于统计的分类方法,是大数据理论与分析的分类算法中比较常用的一种方法。该算法具有直观、 无需先验统计知识、无师学习等特点, 目前已经成为数据挖掘技术的理论和应用研究方法之一。本文主要研究了K 近邻分类算法,首先简要地介绍了数据挖掘中的各种分类算法,详细地阐述了K 近邻算法的基本原理和应用领域,最后在matlab 环境里仿真实现,并对实验结果进行分析,提出了改进的方法。关键词: K 近邻,聚类算法,权重,复杂度,准确度1.引言 ........................................................................................... 1 2.研究目的与意义 ...................................................................... 1 3.算法思想 ................................................................................... 2 4.算法实现 ................................................................................... 2 4.1 参数设置 ......................................................................... 2 4.2 数据集 .............................................................................. 2 4.3 实验步骤 .......................................................................... 3 4.4 实验结果与分析.............................................................. 3 5.总结与反思 .............................................................................. 4 附件 1 .......................................................................................... 6 1 1.引言随着数据库技术的飞速发展,人工智能领域的一个分支——机器学习的研究自 20 世纪 50 年代开始以来也取得了很大进展。用数据库管理系统来存储数据, 用机器学习的方法来分析数据,挖掘大量数据背后的知识,这两者的结合促成了数据库中的知识发现(Knowledge Discovery...