大数据理论与技术读书报告-----K 最近邻分类算法指导老师: 陈 莉学生姓名: 李阳帆学号 : 201531467 专业 : 计算机技术日期 :2016 年 8 月 31 日摘要数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合, 让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不同应用的需要
K 近邻算法( KNN )是基于统计的分类方法,是大数据理论与分析的分类算法中比较常用的一种方法
该算法具有直观、 无需先验统计知识、无师学习等特点, 目前已经成为数据挖掘技术的理论和应用研究方法之一
本文主要研究了K 近邻分类算法,首先简要地介绍了数据挖掘中的各种分类算法,详细地阐述了K 近邻算法的基本原理和应用领域,最后在matlab 环境里仿真实现,并对实验结果进行分析,提出了改进的方法
关键词: K 近邻,聚类算法,权重,复杂度,准确度1
研究目的与意义
1 参数设置