1 第8章 典型相关分析 典型相关分析是用来描述两组随机变量(两个随机向量)间关系的统计分析方法。两组随机向量,各含有许多随机变量,能否用少量随机变量来描述其相关性?例如为了研究饲料与荤菜价格的关系,统计若干年玉米、大豆、稻子、麦子、鱼粉以及猪肉、牛肉、羊肉、鸡肉、鸡蛋、鸭肉、鸭蛋的价格,分析饲料与荤菜价格的关系时,发现单独一种饲料和单独一种肉蛋禽价格关系并不密切(由显著性检验可见),但饲料的某种综合价格则与肉蛋禽综合价格的关系很密切。把饲料价格看成一组随机变量,肉蛋禽价格看成另一组随机变量,找这两组随机变量的线性组合,使之相关系数平方最大,从而分析两组随机变量间的关系,判定这两组随机变量是否有关联,这就是典型相关分析。 8.1 典型相关分析数学模型 设随机向量)',...(1pxxX 与)',...(1pyyY 的方差yyxx ,存在,协方差为xyYX),cov(。ba,为常数向量。则 1/ 2( ', ' )'/( '')xyxxyycorr a X b Yab aabb, 为了计算确定性,限制,1')'(aaXaDxx1')'(bbYbDyy。 定义8 .1 设11,bbaa在条件: ,1')'(aaXaDxx1')'(bbYbDyy 下使 co v (',')a X b Y 大 , 则 称YbwXav','1111为 第一 对典 型 相 关 变 量 ,co v (',')a X b Y 称为第一典型相关系数。 由定义可见,11, wv尽可能多地反映原来 p 对随机变量相关的信息。第一对典型相关变量往往不能完全反映随机向量间的关系,必须建立其它典型相关变量,它应当最能反映随机向量间的关系,但是它应当与第一对典型相关变量不相关(不包含第一对典型相关变量的信息)。 定义8 .1′ 若常数向量 a =2a ,b =2b 在条件: ( ')'1xxD a Xaa ,1')'(bbYbDyy; 0)',cov(1Xav,0)',cov(1Ybw 下使cov( ', ' )a X b Y 最大,则称YbwXav','2222为第二对典型相关变量, 2 22cov(',' )aX b Y 称为第二典型相关系数。若常数向量a =3a ,b =3b 在条件:( ')1D a X ,1)'(YbD; 0)',cov (1Xav,0)',cov (1Ybw; 0)',cov (2Xav,0)',cov (2Ybw, 下使22cov(',' )aX b Y 最大,则称YbwXav','3333为第三对典型相关变量,33cov(',' )aX b Y 称为第三典型相关系数。…… 求第一对典型相关变量是在条件: ,1')'(aaXaDxx1')'(bbYbDyy 下使cov( ', ' )'xya X b Yab...