本文在阐述聚类分析方法的基础上重点研究 FCM 聚类算法
FCM 算法是一种基于划分的聚类算法,它的思想是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小
最后基于 MATLAB 实现了对图像信息的聚类
第 1 章 概述 聚类分析是数据挖掘的一项重要功能,而聚类算法是目前研究的核心,聚类分析就是使用聚类算法来发现有意义的聚类,即“物以类聚”
虽然聚类也可起到分类的作用,但和大多数分类或预测不同
大多数分类方法都是演绎的,即人们事先确定某种事物分类的准则或各类别的标准,分类的过程就是比较分类的要素与各类别标准,然后将各要素划归于各类别中
确定事物的分类准则或各类别的标准或多或少带有主观色彩
为获得基于划分聚类分析的全局最优结果,则需要穷举所有可能的对象划分,为此大多数应用采用的常用启发方法包括:k-均值算法,算法中的每一个聚类均用相应聚类中对象的均值来表示;k-medoid 算法,算法中的每一个聚类均用相应聚类中离聚类中心最近的对象来表示
这些启发聚类方法在分析中小规模数据集以发现圆形或球状聚类时工作得很好,但当分析处理大规模数据集或复杂数据类型时效果较差,需要对其进行扩展
而模糊C 均值(Fuzzy C-means, FCM)聚类方法,属于基于目标函数的模糊聚类算法的范畴
模糊C 均值聚类方法是基于目标函数的模糊聚类算法理论中最为完善、应用最为广泛的一种算法
模糊c 均值算法最早从硬聚类目标函数的优化中导出的
为了借助目标函数法求解聚类问题,人们利用均方逼近理论构造了带约束的非线性规划函数,以此来求解聚类问题,从此类内平方误差和 WGSS(Within-Groups Sum of Squared Error)成为聚类目标函数的普遍形式
随着模糊划分概念的提出,Dunn [10] 首先将其推广到加权 WGSS 函数,后来由 Bezdek 扩展到加权 W