1 第8章 典型相关分析 典型相关分析是用来描述两组随机变量(两个随机向量)间关系的统计分析方法
两组随机向量,各含有许多随机变量,能否用少量随机变量来描述其相关性
例如为了研究饲料与荤菜价格的关系,统计若干年玉米、大豆、稻子、麦子、鱼粉以及猪肉、牛肉、羊肉、鸡肉、鸡蛋、鸭肉、鸭蛋的价格,分析饲料与荤菜价格的关系时,发现单独一种饲料和单独一种肉蛋禽价格关系并不密切(由显著性检验可见),但饲料的某种综合价格则与肉蛋禽综合价格的关系很密切
把饲料价格看成一组随机变量,肉蛋禽价格看成另一组随机变量,找这两组随机变量的线性组合,使之相关系数平方最大,从而分析两组随机变量间的关系,判定这两组随机变量是否有关联,这就是典型相关分析
1 典型相关分析数学模型 设随机向量)',
(1pxxX 与)',
(1pyyY 的方差yyxx ,存在,协方差为xyYX),cov(
ba,为常数向量
则 1/ 2( ', ' )'/( '')xyxxyycorr a X b Yab aabb, 为了计算确定性,限制,1')'(aaXaDxx1')'(bbYbDyy
1 设11,bbaa在条件: ,1')'(aaXaDxx1')'(bbYbDyy 下使 co v (',')a X b Y 大 , 则 称YbwXav','1111为 第一 对典 型 相 关 变 量 ,co v (',')a X b Y 称为第一典型相关系数
由定义可见,11, wv尽可能多地反映原来 p 对随机变量相关的信息
第一对典型相关变量往往不能完