1回归分析的基本思想及其初步应用温故知新温故知新我们通过一个微视频来回忆一下必修三中回归分析的相关内容
所以回归方程是0
712yx所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为0
84917285
316()ykgnniiiii=1i=1nn222iii=1i=1(x-x)(y-y)xy-nxyb===0
849,(x-x)x-nxa=y-bx=-85
712问题1身高为172cm的女大学生的体重一定是60
316kg吗
如果不是,这是由什么原因引起的呢
解:回归直线从散点图还看到,样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a简单描述它们关系
我们可以用下面的线性回归模型来表示:y=bx+a+e,其中a和b为模型的未知参数,e称为随机误差
产生随机误差项e的原因是什么
问题2:产生随机误差项e的原因是什么
随机误差e的来源(可以推广到一般):1、其它因素的影响:影响体重y的因素不只是身高x,可能还包括遗传基因、饮食习惯、生长环境等因素;2、用线性回归模型近似真实模型所引起的误差;3、身高x的观测误差
线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和随机误差项e共同确定,即自变量x只能解析部分y的变化
在统计中,我们也把自变量x称为解析变量,因变量y为预报变量
问题3:在线性回归模型中,是用预报真实值的误差,它是一个不可观测的量,那么应该怎样研究随机误差呢
ebxay随机误差的估计值,我们称为残差
ˆe残差数据点和它在回归直线上相应位置的差异称为相应于点(xi,yi)的残差
iiieyy=例:编号为6的女大学生,计算随机误差的效应(残差)61(0
84916585
627残差平方和把每一个残差所得的值