ˆyy=bx+a+e其中a和b为模型的未知参数,e是y与之间的误差,通常e称为随机误差
2E(e)=0,D(e)=σy=bx+a+eˆˆˆnniiiii=1i=1nn222iii=1i=1(x-x)(y-y)x-nxyb==,(x-x)x-nxa=y-bxy所求直线方程叫做回归直线方程;其中ˆˆˆy=bx+a线性回归模型预报精度1
相关指数R22
残差enn22iii2i=1i=1nn22iii=1i=1(y-y)(y-y)R=1-=(y-y)(y-y)在含有一个解释变量的线性模型中R2=r2(相关关系)判断xi确定差异百分数随机误差,它的估计值为
e=y-ye=y-y对于样本点它们随机误差的估计值称相应残差
1122nn(x,y),(x,y),,(x,y)iiiiie=y-y=y-bx-an22iii=111σ=(y-bx-a)=Q(a,b)(n>2)n-2n-2方差1)衡量预报精度2)确定样本的异常点
1)确定解释变量和预报变量;2)画出散点图;3)确定回归方程类型;4)求出回归方程;5)利用相关指数或残差进行分析
建立回归模型的基本步骤问题:一只红铃虫的产卵数y与温度x有关,现收集了7组观测数据,试建立y与x之间的回归方程温度x21232527293235产卵数y711212466115325解:1)作散点图;050100150200250300350202224262830323436温度产卵数从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似
这些散点更像是集中在一条指数曲线或二次曲线的附近
解:令则z=bx+a,(a=lnc1,b=c2),列出变换后数据表并画出x与z的散点图z=lnyx和z之间的关系可以用线性回归模型来拟合z=ax+b+e2cx1用y=ce模型;1)x2123252729