电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

讲有关分析与回归分析VIP免费

讲有关分析与回归分析_第1页
1/21
讲有关分析与回归分析_第2页
2/21
讲有关分析与回归分析_第3页
3/21
1/21第二讲相关分析与回归分析第一节相关分析1.1变量的相关性1.变量的相关性分两种,一种是研究两个变量X与Y的相关性。本节只研究前者,即两个变量之间的相关性;。2.两个变量X与Y的相关性研究,是探讨这两个变量之间的关系密切到什么程度,能否给出一个定量的指标。这个问题的难处在于“关系”二字,从数学角度看,两个变量X、Y之间的关系具有无限的可能性,一个比较现实的想法是:确立一种“样板”关系,然后把X、Y的实际关系与“样板”关系比较,看它们“像”到了什么程度,给出一个定量指标。3.取什么关系做“样板”关系?线性关系。这是一种单调递增或递减的关系,在现实生活中广为应用;另外,现实世界中大量的变量服从正态分布,对这些变量而言,可以用线性关系或准线性关系构建它们之间的联系。1.2相关性度量1.概率论中用相关系数(correlationcoefficient)度量两个变量的相关程度。为区别以下出现的样本相关系数,有时也把这里定义的相关系数称为总体相关系数。可见相关系数是判断变量间线性关系的重要指标。2.样本相关系数我们也只能根据这个容量为n的样本来判断变量X和Y的相关性达到怎样的程度。2/21这个估计称为样本相关系数,或Pearson相关系数。它能够根据样本观察值计算出两个变量相关系数的估计值。和总体相关系数一样,如果0XY,称X和Y不相关。这时它们没有线性关系。多数情况下,样本相关系数取区间(1,1)中的一个值。相关系数的绝对值越大,表明X和Y之间存在的关系越接近线性关系。1.3相关性检验两个变量X和Y之间的相关性检验是对原假设H0:Corr(X,Y)=0的显著性进行检验。检验类型为t。如果H0显著,则X和Y之间没有线性关系。1.4计算样本相关系数Correlate\Bivariate例1数据data02,计算变量当前薪金、起始薪金、受教育年限和工作经验之间的样本相关系数。打开Correlate\Bivariate对话框,将变量salary、salbegin、educ和prevexp输入Variables,点击OK,即得表格:Correlations1.661**.633**-.252**..000.000.000474474474474.661**1.880**-.097*.000..000.034474474474474.633**.880**1.045.000.000..327474474474474-.252**-.097*.0451.000.034.327.474474474474PearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)N受教育年限当前薪金起始薪金工作经验(月)受教育年限当前薪金起始薪金工作经验(月)Correlationissignificantatthe0.01level(2-tailed).**.Correlationissignificantatthe0.05level(2-tailed).*.3/21表格中的PearsonCorrelation指样本相关系数,例如起始薪金与受教育年限的相关系数为0.633;Sig.为相关性检验结果,起始薪金与受教育年限的相关性检验结果为Sig.=0.000,在0.05和0.01的水平下,都能否定它们不相关的假设。N为观察值个数。1.5偏相关系数1.控制变量以上在计算变量X和Y的相关系数时,并没有考虑有其他变量的影响。例如:计算当前薪金(salary)与起始薪金(salbegin)的相关系数得0.890,但是当前薪金显然还受到受教育年限(educ)的影响,这个影响在计算相关系数时没有被扣除,因此0.890这个数字不完全真实。如扣除educ的影响,在计算salary和salbegin的相关系数,就更接近真实了。这个被扣除的变量就叫控制变量,这里educ便是控制变量。控制变量可以不止一个。2.偏相关系数扣除控制变量影响后得到的相关系数称为偏相关系数(partialcorrelation),计算命令为:Correlate\Partial.例2数据data02,计算当前薪金与起始薪金在扣除受教育年限影响后的偏相关系数。在PartialCorrelations对话框中,将变量salary、salbegin输入Variables,将变量educ输入Controllingfor,然后OK,得:Correlations1.000.795..0000471.7951.000.000.4710CorrelationSignificance(2-tailed)dfCorrelationSignificance(2-tailed)df当前薪金起始薪金ControlVariables受教育年限当前薪金起始薪金其中Corrlation指偏相关系数,df自由度,Significance是对原假设H0:pCorr(X,Y)=0检验结果得到的水平值。可见:偏相关系数值等于0.795;不能接受不相关的假设。4/21第二节...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

讲有关分析与回归分析

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部