第四章回归分析第四章回归分析变量间相互作用、相互影响,但又难以用定量数学方程表达的关系称变量间相互作用、相互影响,但又难以用定量数学方程表达的关系称为为相关关系。相关关系。回归分析回归分析是研究和处理变量之间相关关系的一个数理统计方法。是研究和处理变量之间相关关系的一个数理统计方法。回归分析能解决的问题:回归分析能解决的问题:((11)可提供变量间相关关系的数学表达式;并利用概率统计基础知识,)可提供变量间相关关系的数学表达式;并利用概率统计基础知识,来判断所建立的经验公式的有效性;来判断所建立的经验公式的有效性;((22)可利用所得的经验公式,根据一个或几个变量的值,预测或控制)可利用所得的经验公式,根据一个或几个变量的值,预测或控制另一个变量的取值;并给出这种预测或控制可达到什么样的精确程度。另一个变量的取值;并给出这种预测或控制可达到什么样的精确程度。((33)进行因素分析,例如在对于共同影响一个变量的许多因素之间,)进行因素分析,例如在对于共同影响一个变量的许多因素之间,找出哪些是重要因素,哪些是次要因素,这些因素之间又有什么关系。找出哪些是重要因素,哪些是次要因素,这些因素之间又有什么关系。4.14.1一元线性回归分析一元线性回归分析回归分析的分类:回归分析的分类:处理多个变量之间的相关关系称为处理多个变量之间的相关关系称为多元回归分析多元回归分析。。处理两个变量之间的关系称为处理两个变量之间的关系称为一元回归分析一元回归分析。。若两个变量间成线性关系,则称为若两个变量间成线性关系,则称为一元线性回归一元线性回归。。如果变量之间不具有线性关系,则称之为如果变量之间不具有线性关系,则称之为非线性回归非线性回归。。4.1.14.1.1回归系数的最小二乘估计回归系数的最小二乘估计xy这种与所有观测点最为接近的直线称为回归直线。回归直线的方程ŷ=a+bx称为回归方程,其中a为常数项,b为回归系数。对于每个观测值xi,由回归方程可确定一个回归值ŷi=a+bxi。这个回归值ŷi与实际观测值yi的偏差yi–ŷi=yi–a–bxi刻画了yi与ŷi的偏离程度。所有偏差的平方和就定量地描述了全部观测点(xi,yi)(i=1,2,…,n)与直线ŷ=a+bx沿y轴的方向的偏离程度。这个量随a,b而变化,是a,b的二元函数,记为niiibxaybaQQ12),(显然,偏差平方和愈小的直线,愈能较好地反应x与y之间的关系。““最小二乘法”就是使最小二乘法”就是使QQ((aa,,bb)达到最小的一种确定)达到最小的一种确定aa,,bb的的方法。方法。020211iniiiniiixbxaybQbxayaQ{联合求解得:联合求解得:niiniiiniiniiixnxyxnyxxxyyxxbxbya1221121)())(({这里:这里:niiniiynyxnx111;1若记若记则有则有212121121221)())(()(ynyyylyxnyxyyxxlxnxxxlniiniiyyniiiniiixyniiniixxxbyallbxxxy,若把代入若把代入ŷŷ==a+bxa+bx,可,可得回归方程的另一种形式得回归方程的另一种形式xbyaxbya)(ˆxxbyy由此可见,回归直线是通过散点图几何重心点由此可见,回归直线是通过散点图几何重心点的直线,明确这一点,对回归直线的作图很有帮助。的直线,明确这一点,对回归直线的作图很有帮助。),(yx4.1.24.1.2一元线性回归方程的检验一元线性回归方程的检验回归方程的检验方法有两种,即回归方程的检验方法有两种,即相关系数法相关系数法和和方差分析法方差分析法。。((11)相关系数法)相关系数法yyxxxyniniiiniiilllyyxxyyxxr11221)()())((相关系数相关系数rr定量地描述了两个变量定量地描述了两个变量xx和和yy之间的线性相关程度。可以之间的线性相关程度。可以验证验证-1≤-1≤rr≤≤11。。相关系数的几何意义相关系数的几何意义│rr│越接近于1,x和y之间的线性关系越好。当│rr│=1时,图上的点全部落在一条直线上。若rr=0,则可认为x和y之间没有线性关系。这时有两种情...