高中数学《回归分析》学案 1 北师大版选修 1-2知识引入你知道日常生活中的天气预报是如何实现的吗?气象学家根据既往的温度、湿度以及降雨等资料,就可以预报未来一段时间某地的天气变化情况。这要求对这些变量之间的关系有精确的掌握。前面的学习中,我们知道相关分析可用来帮助我们分析变量之间关系的强度;而倘若要确定变量之间数量关系的可能形式也即数量模型,则通常可采用回归分析法。回归分析的应用十分广泛,它不但适用于实验数据,还可以分析未作实验控制的观测数据或历史资料。 有人可能会好奇,为什么叫“回归”这个名称,它有什么具体含义?实际上,回归这种现象最早由英国生物统计学家高尔顿在研究父母亲和子女的遗传特性时所发现的一种有趣的现象:身高这种遗传特性表现出“高个子父母,其子代身高也高于平均身高;但不见得比其父母更高,到一定程度后会往平均身高方向发生‘回归’”。这种效应被称为“趋中回归”。现在的回归分析则多半指源于高尔顿工作的那样一整套建立变量间数量关系模型的方法和程序。本章以回归分析中最简单的一元线性回归为例介绍回归分析基本原理,接着概括一元线性回归的主要过程,最后介绍多元线性回归。第一节 回归分析基本原理 两变量间的相关关系可以用散点图来反映,图中的每个点都代表一个变量配对样本点,它是自变量与因变量间关系的一个具体代表。在相关分析中,我们详细地分析过相关关系的几何意义和数量特点。显然,若这些散点都落在一条直线上(完全相关),则该条直线当然能够代表变量间的数量关系——一次函数关系。但在回归分析中,我们要解决的是一般情况下(不完全相关),如何寻找一条最恰当的直线能代表呈线性关系的两个变量间的直线关系趋势,也就是能够最大程度拟合这些散点的直线。 最小二乘法原理 我们将那条要找的直线用 = a + bx 来表示,这个方程称为回归方程。这里之所以用而不用 y,是因为 (x,y) 是实际观测的值,而直线上的点(x, )不一定在实际中会出现,也就是说是估计值。 线性回归的目的就是去确定回归方程中的系数 a 和 b,这些系数称为回归系数。确定回归系数通常利用最小二乘法原理,即满足最佳拟合要求的回归直线应当使得该直线与所有散点在纵坐标上的总偏差(如上图,这个偏差就是估计值和观测值间的差异,也就是误差)达到最小,下面是用最小二乘法求回归系数的推导过程。 一个点到直线的沿 y 轴方向的距离可以表示为: 所有点到直线的沿 y...