经济类核心课程·计量经济学PowerPointPresentationbyLuShiguang2012AllRightReserved,HunanInstituteofEngineering第一章双变量回归分析教师:卢时光1
回归分析的性质F
加尔顿(FrancisGalton)发现,虽然有一个趋势:父母高,儿女也高;父母矮,儿女也矮,但给定父母的身高,儿女辈的平均身高却趋向于或者“回归”到全体人口的平均身高
皮尔逊(KarlPearson)证实了加尔顿普遍回归定律
皮尔逊收集了1000多个家庭的身高记录
他发现对于父辈高的群体,儿辈的平均身高低于他们的父辈,而对于父辈矮的群体,儿辈的平均身高则高于他们的父辈
用加尔顿的话来说,就是“回归到中等(regressiontomediocrity)”
2回归的现代定义回归分析是关于研究一个应变量对另一个解释变量的依赖关系,其用意在于通过后者(在重复抽样中)的已知或设定值,去估计和(或)预测前者的(总体)均值
回到加尔顿的例子:我们关心给定父辈身高,找出儿辈平均身高的变化
值得注意的是,随着父辈身高的增加,儿辈平均身高也在增加
607080父辈的身高(英寸)儿辈的身高(英寸)807060如左图所示:注意对应任一给定的父辈的身高,都有一个儿辈身高的分布范围
我们勾画了一条通过这些散点的一条直线,以表示儿辈平均身高如何随父辈身高的增加而增加的
这条线我们称为回归线(regressionline)
3统计关系和确定性关系如上例中,我们不像经典物理学中考虑的那种变量之间的函数或确定性依赖关系
在回归分析中,我们考虑的是一类所谓统计依赖关系
在变量之间的统计关系中,我们主要处理是随机变量,也就是有着概率分布的变量
例如,作物收成对气温、降水、阳光及施肥的依赖关系是统计性质的
这个性质的意义在于:这些解释变量固然