精品文档---下载后可任意编辑典型相关分析基本概念典型相关分析(canonical correlation analysis)是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。典型相关分析是由霍特林(Hotelling,1935,1936)首先提出的。 典型相关分析的目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析。 目前,典型相关分析已被广泛应用于心理学、市场营销等领域,如用于讨论个人性格与职业兴趣的关系,市场促销活动与消费者响应之间的关系等。1.2 典型相关分析的基本思想典型相关分析的基本思想和主成分分析非常相似。首先在每组变量中找出变量的一个线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取相关系数仅次于第一对线性组合并且与第一对线性组合不相关的第二对线性组合,如此继续下去,直到两组变量之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间联系的强度。一般情况,设、 是两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量 Ui、Vi ,使得每一个综合变量是原变量的线性组合,即:为了确保典型变量的唯一性,我们只考虑方差为 1 的、的线性函数与,求使得它们相关系数达到最大的这一组。若存在常向量,,在的条件下,使得达到最大,则称、是、的第一对典型相关变量。求出第一对典型相关变量之后,可以类似的求出各对之间互不相关的第二对、第三对等典型相关变量。这些典型相关变量就反映了,之间的线性相关情况。这里值得注意的是,我们可以通过检验各对典型相关变量相关系数的显著性,来反映每一对综合变量的代表性,假如某一对的相关程度不显著,那么这对变量就不具有代表性,不具有代表性的变量就可以忽略。这样就可以通过对少数典型相关变量的讨论,代替原来两组变量之间的相关关系的讨论,从而容易抓住问题的本质。2 典 型 相 关 分 析 原 理 及 方 法设有两组随机向量,代表第一组的p 个变量,代表第二组的q 个变量,假设p≤q 。令根据典型相关分析的基本思想,要...