电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

SPSS聚类分析详解VIP免费

SPSS聚类分析详解_第1页
1/80
SPSS聚类分析详解_第2页
2/80
SPSS聚类分析详解_第3页
3/80
聚类分析聚类分析是研究(样品或指标)分类问题的一种多元统计方法。类是指相似元素的集合。分类:1、系统聚类法------(分层聚类)系统聚类法是应用最广泛的一种(HierarchicalCluster过程)1)、聚类原则:都是相近的聚为一类,即距离最近或最相似的聚为一类。2)、分层聚类的方法可以用于样本聚类(Q)型,也可以用于变量聚类(R型)。2、非系统聚类法-----(快速聚类法----K-均值聚类法)(K-meansCluster)3、两步聚类法-----一种探索性的聚类方法(TwoStepCluster)K-均值聚类分析K-meansCluster又称为快速样本聚类法,是非系统聚类中最常用的聚类法。优点:是占内存少、计算量小、处理速度快,特别适合大样本的聚类分析。缺点:应用范围有限,要求用户制定分类数目(要告知),只能对观测量(样本)聚类,而不能对变量聚类,且所使用的聚类变量必须都是连续性变量。基本原理具体做法1、按照指定的分类数目n,按某种方法选择某些观测量,设为{Z1,Z2,…Zn},作为初始聚心。2、计算每个观测量到各个聚心的欧氏距离。即按就近原则将每个观测量选入一个类中,然后计算各个类的中心位置,即均值,作为新的聚心。3、使用计算出来的新聚心重新进行分类,分类完毕后继续计算各类的中心位置,作为新的聚心,如此反复操作,直到两次迭代计算的聚心之间距离的最大改变量小于初始聚类心间最小距离的倍数时,或者到达迭代次数的上限时,停止迭代。2112mkjkikjiijxxzxd数据标准化处理:存储中间过程数据数据标准化处理,并存储。指定5类收敛标准值存储最终结果输出情况,在数据文件中(QCL-1、QCL-2)初始聚心选项,输出方差分析表初始聚类中心表具体城市看后表最终聚类中心表聚类结果:QCL-1说明聚类结果,QCL-2说明聚类的长度情况系统聚类法HierarchicalCluster系统聚类法优点:既可以对观测量(样品)也可对变量进行聚类,既可以连续变量也可以是分类变量,提供的距离计算方法和结果显示方法也很丰富。应用实例某电冰箱厂开发某一新产品,在投放市场前希望对以往经销的国内6个地区征集对新产品的评价,若对新产品的评价指标有三项:式样、性能、颜色,评价的调整表采用10分制,调查结果的数据如下表123456性能9110928颜色827946式样728357地区(样品)指标用分类法对6个样品进行分类,以估计哪些地区最有可能经销这类新产品?按公式计算两两样品间的相似系数,得相似矩阵)()(ijijqCosQ1916.0921.01928.0994.01787.0899.0994.0910.01927.0841.0955.01914.0994.01933.01123456123456Q=按四条原则进行分类作聚类分析图X3X6X1X4X2X510.9940.9550.9940.933一、问题提出聚类分析——对一批样品或指标进行分类的一种统计方法。具体处理方法:(思路)1、具体研究的分类对象:样品或指标2、方法:把“性质相似”或“相互关系密切”的样品或指标聚在一起。3、步骤:1)首先给出度量“相似”或“关系密切”的统计指标2)形成一个由小到大的分析系统。3)把整个分类系统画成一张分类图(3)相关系数(4)关联系数指标:(1)统计指标是相似系数。根据相似性归为一类,否则为另一类。(2)统计指标是样品(空间的点)之间的距离将距离近的点归成一类,否则为另一类。二、聚类统计量首先定义一些分类统计指标——刻画样或指标之间的相似程度(这些统计指标称为聚类统计量)在市场研究中,样品——用作分类的事物指标——用来作为分类依据的变量。(如:年龄、收入、销售量)(一)相似系数(夹角余弦)一般式:假定每个样品包含有P项指标,若有几个样品的调查数据pXXXX112111pXXXX222212npnnnXXXX21每一个样品都可看成P维空间中的一个向量对于任意两个样品Xi和Xj的相似程度可用这两个向量之间的夹角余弦ijCos来表示:Xi和Xj相重合时,夹角0ij相似程度为100CosCosijXi和Xj相互垂直时,2ij相似程度为02CosCosij相似密切解析几何知识:相似系数pkpkjkikpkjkikjijiijXXXXXXX...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

SPSS聚类分析详解

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部