开题报告论文(设计)题目浅谈谱聚类算法及应用一、论文(设计)选题的依据(选题的目的和意义、该选题国内外的研究现状及发展趋势、主要参考文献等)(一)选题的目的与意义选题目的:在这个大数据时代,数据分析是一个很重要的问题,聚类技术的发展,大大缓解了这种情况
在模式识别领域,谱聚类的出现成为了学者研究的焦点
由于谱聚类算法复杂程度低,实现比较容易等特点,在各个领域受到了许多专家的肯定,成为一个重要的研究对象
经过国内外专家学者不断研究和探索,谱聚类算法得到了很大的发展,但是也存在一些问题,随着研究的深入,出现各种各样的谱聚类算法,但是这些算法的实现方法都是十分相似的
研究意义:谱聚类算法大致上可以分为以PF算法为代表的二路谱聚类算法和以NJW算法为代表的多路谱聚类算法两种类型
二路谱聚类算法使用的主要是图的二路划分准则,多路谱聚类算法使用的主要是图的多路划分准则
应用比较广泛的谱聚类算法主要包括二路谱聚类算法中的PF算法,SM算法,SLH算法和多路谱聚类算法中的NJW算法
谱聚类算法建立在图论中的谱图理论基础上,其本质是将聚类问题转化为图的最优划分问题,是一种点对聚类算法,对数据聚类具有很好的应用前景
(二)国内外的研究现状以及发展趋势谱聚类的诞生可以追溯到1973年,donath和hoffman首次基于邻接矩阵构造了图的划分
在同一年,fieldler发现图的二划分与laplacian图的第二小特征向量有密切关系,并且建议使用该特征向量进行图的划分
从此以后,许多研究者加入到谱聚类方法的研究队伍中
国外研究现状:对于特征向量的选取,Jenssen等人通过对Renyi熵的研究,推导出该熵的最大化的近似解就是相似矩阵取得较大值的前k个特征向量
TaoXiang,ShaogangGong认为最优的聚类结果不一定是最大的K个特征值对应的特征向量,他提出了一个新的的概念为向量相关度,用向