实验十三商品需求量的预测【实验目的】1.了解回归分析的基本原理和方法。2.学习用回归分析的方法解决问题,初步掌握对变量进行预测和控制。3.学习掌握用MATLAB命令求解回归分析问题。【实验内容】现有某种商品的需求量、消费者的平均收入、商品价格的统计数据如表1所示,试用所提供的数据预测消费者平均收入为1000、商品价格为6时的商品需求量。需求量10075807050659010011060收入10006001200500300400130011001300300价格5766875439【实验准备】现实生活中,一切事物都是相互关联、相互制约的。我们将变化的事物看作变量,那么变量之间的相互关系,可以分为两大类:一类是确定性关系,也叫作函数关系,其特征是一个变量随着其它变量的确定而确定,如矩形的面积由长宽确定;另一类关系叫相关关系,其特征是变量之间很难用一种精确的方法表示出来,如商品销量与售价之间有一定的关联,但由售价我们不能精确地计算出销量。不过,确定性关系与相关关系之间没有一道不可逾越的鸿沟,由于存在实际误差等原因,确定性关系在实际问题中往往通过相关关系来体现;另一方面,当对事物内部规律了解得更加深刻时,相关关系也可能转化为确定性关系。1.回归分析的基本概念回归分析就是处理变量之间的相关关系的一种数学方法,它是最常用的数理统计方法,能解决预测、控制、生产工艺化等问题。由相关关系函数确定形式的不同,回归分析一般分为线性回归、非线性回归和逐步回归,在这里我们着重介绍线性回归,它是比较简单的一类回归分析,在实际问题的处理中也是应用得较多的一类。回归分析中最简单的形式是y=0+1x+(x、y为标量)(1)固定的未知参数0,1称为回归系数,自变量x称为回归变量,是均值为零的随机变量,它是其他随机因素对y的影响,是不可观察的,我们称(1)为一元线性回归。它的一个自然推广是x是多元变量,形如y=0+11x+⋯+mmx+(2)m≥2,我们称为多元线性回归,或者更有一般地y=0+1)(1xf+⋯+m)(xfm+(3)其中x=(1x,⋯,mx),)(xfj(j=1,⋯,m)是已知函数,称为非线性回归(也叫曲线或曲面回归)。不难看出,对自变量x作变量替换,一般能够将非线性回归(3)转化为线性回归(2)的形式进行求解分析,所以我们着重讨论线性回归的内容。对(2)式两边同时取数学期望得Y=X+(E=0,D=2)(4)其中111x⋯mx11yX=⋯⋯⋯Y=⋯11nx⋯nmxny=(0,1,⋯,m)T,=(1,2,⋯,n)T(4)式称为线性回归方程。线性回归分析所要考虑的主要任务是:用试验值(样本值)对未知参数和2作点估计,同时对估计值作假设检验,从而确立y与1x,⋯,mx之间的数量关系;在0x=(01x,⋯,mx0)处对y值作预测与控制,即对y作区间估计。这里我们均假设样本容量大于变量个数,即n>m+1。2.模型的参数估计和假设检验用最小二乘法估计模型(4)中的参数,作离差平方和Q=nii12=21110).....(immniiixxy(5)求使得Q达到最小。根据微积分学中求极值的方法,只需求Q关于0,1,⋯,m一阶导数为0的方程组的解,此解不是0,1,⋯,m的真值,而是的最小二乘估计值,我们用0,1,⋯,m表示=YXXXTT1)((6)将的估计值0,1,⋯,m代入回归方程(4)得到y的估计值y=0+11x+⋯+mmx(7)拟合误差e=y-y称为残差,可作为随机误差的估计,而Q=niie12=niiy12i)(y(8)为残差平方和(或剩余平方和),即)(Q。在实际问题中,事先我们并不知道或者不能断定随机变量y与一组变量1x,⋯,mx之间有线性关系,如(2)式y=0+11x+⋯+mmx+往往只是一种假设,因此在求出线性回归方程后,还须对求出的线性回归方程同实际观测数据拟合效果进行检验,可提出以下原假设:0H:0=1=⋯=m=0(9)采用F检验法或R检验法(详细内容在数理统计类书籍中均可查到,此处不再赘述),拒绝0H,则认为y与1x,⋯,mx之间显著地有线性关系;否则就接受0H,认为y与1x,⋯,mx之间线性关系不显著。3.变量的预测与控制当回归模型和系数通过了假设检验后,可由给定的0x=(01x,⋯,mx0)预测出0y,0y是随机的,显然由回归方程(7)知道,其预测值(点估计)为0y=0+101x+⋯+mmx0(10)对于给定的显著水平a,可以...