0可编辑可修改195195第9章K-Means聚类、辨别分析9
1理解聚类分析餐饮企业经常会碰到这样的问题:1)如何通过餐饮客户消费行为的测量,进一步评判餐饮客户的价值和对餐饮客户进行细分,找到有价值的客户群和需关注的客户群2)如何合理对菜品进行分析,以便区分哪些菜品畅销毛利又高,哪些菜品滞销毛利又低餐饮企业遇到的这些问题,可以通过聚类分析解决
1常用聚类分析算法与分类不同,聚类分析是在没有给定划分类别的情况下,根据数据相似度进行样本分组的一种方法
与分类模型需要使用有类标记样本构成的训练数据不同,聚类模型可以建立在无类标记的数据上,是一种非监督的学习算法
聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度将他们划分为若干组,划分的原则是组内样本最小化而组间(外部)距离最大化,如错误
未找到引用源
图9-1聚类分析建模原理常用聚类方法见错误
未找到引用源
表9-1常用聚类方法v1
0可编辑可修改196196类别包括的主要算法划分(分裂)方法K-Means算法(K-平均)、K-MEDOIDS算法(K-中心点)、CLARANS算法(基于选择的算法)层次分析方法BIRCH算法(平衡迭代规约和聚类)、CURE算法(代表点聚类)、CHAMELEON算法(动态模型)基于密度的方法DBSCAN算法(基于高密度连接区域)、DENCLUE算法(密度分布函数)、OPTICS算法(对象排序识别)基于网格的方法STING算法(统计信息网络)、CLIOUE算法(聚类高维空间)、WAVE-CLUSTER算法(小波变换)基于模型的方法统计学方法、神经网络方法常用聚类算法见错误
未找到引用源
表9-2常用聚类分析算法算法名称算法描述K-MeansK-均值聚类也叫快速聚类法,在最小化误差函数的基础上将数据划分为预定的类数K
该算法原理简单并便于处理大量数据
K-中心点K