精品文档---下载后可任意编辑本讲分为两个部分:第一部分是对相关性问题的讨论,作为多重共线性问题的基础,第二部分则是对多重共线性问题展开讨论。第一部分:相关理论1.相关理论相关分析是讨论变量间相互关系的最基本方法。从相关分析中引出的相关系数是回归分析的一个基本统计量。掌握它有助于对经济问题和经济计量模型的分析与理解。1.1 相关的定义与分类定义:相关(correlation)指两个或两个以上变量间相互关系的程度或强度。分类:①按强度分 完全相关:变量间存在函数关系。例,圆的周长,L = 2πr。高度相关(强相关):变量间近似存在函数关系。例,我国家庭收入与支出的关系。 弱相关:变量间有关系但不明显。例,近年来我国耕种面积与产量。 零相关:变量间不存在任何关系。例,某班学生的学习成绩与年龄。 完全相关 高度相关、线性相关、正相关 弱相关 ② 按变量个数分按形式分:线性相关, 非线性相关 简单相关:指两个变量间相关 按符号分:正相关, 负相关, 零相关 复相关(多重相关和偏相关):指三个或三个以上变量间的相关。 非线性相关 负相关 零相关因非线性相关可以转化为线性相关处理,而复相关又可看作是简单相关基础上的拓展,所以后面重点介绍简单线性相关。1.2 简单线性相关的度量用简单线性相关系数,简称相关系数(correlation coefficient)度量两个变量间的线性相关强度,用表示。的随机变量表达式是 =Cov( xt ,yt)√D(xt)√ D( yt)。的统计表达式是 =1T ∑t=1T( xt−μx)( yt−μ y)√1T ∑t=1T( xt−μx)2√1T ∑t=1T( yt−μ y)2= ∑t=1T( xt−μx)( yt−μ y)√∑t=1T( xt−μx)2√∑t=1T( yt−μy)2其中 T,总体容量;xt, yt,变量的观测值;x,y,变量观测值的均值。下面解释 为什么能对变量间的线性相关强度进行定量度量。因为 表达式的分子是协方差,Cov (xt , yt);分母是 xi和 yt的标准差之积。而 xt和 yt的标准差不会为零,所以 Cov (xt , yt) 是否为零,就决定了是否为零,即标志着变量 xt, yt间是否存在线性相关关系。但 Cov(xt, yt) 有两个缺点:①它是一个有量纲的量,取值容易受测量单位的影响;②取值范围宽,相关性越强,Cov(xt , yt) 取值越大。为克服上述缺点,用 xt, yt的标准差除 Cov(xt , yt),于是就得到相关系数的统计表达式。它是一个无量纲量。相关系数是对总体而言。当讨论某个问题...