4 主成分聚类与主成分回归 5
1 变量聚类与样品分类 主成分分析可用于聚类:变量聚类与样品聚类
变量聚类:由主成分系数的差异,可将变量聚类
5中第2主成分中murder,rape, assult系数为负的, burglary,larceny, auto系数是正的
按系数正负可把7个变量分为两类: murder, rape, assult属于暴力程度严重的一类;burglary,larceny,auto属于暴力程度较轻的一类
按照这种方法,根据主成分系数的正负可以将变量聚类
样品聚类:如果2个主成分能很好的概括随机向量的信息,计算每个样品的这两个主成分得分,把他们的散点图画出来,就能从图上将样品分类
例 5 . 5 (续2 ) 按照第一、第二主成分得分,画出散点图 data crime; /*建立数据集crime*/ input state $ 1-15 murder rape robbery assult burglary larceny auto; /*建立变量state murder rape robbery assult burglary larceny auto
state $ 1-15表示前15列存州名
murder rape robbery assult burglary larceny auto 表 7种罪的犯罪率*/ cards; /*以下为数据体*/ Albama 14
3 1135
5 1881
7 Alaska 10
0 1331
7 3369
3 Arirona 9
3 2346
1 4467
5 Arkansas 8
3 2346
1 4467