第二讲线性回归方程一、相关关系:1、1||1||rr不确定关系:相关关系确定关系:函数关系2、相关系数:niiniiniiiyyxxyyxxr12121)()())((,其中:(1)负相关正相关00rr;(2)相关性很弱;相关性很强;3.0||75.0||rr例题1:下列两个变量具有相关关系的是()A.正方形的体积与棱长;B.匀速行驶的车辆的行驶距离与行驶时间;C.人的身高和体重;D.人的身高与视力。例题2:在一组样本数据),,,2)(,(),,(),,(212211不全相等nnnxxxnyxyxyx的散点图中,若所有样本点),2,1)(,(niyxii都在直线121xy上,则样本相关系数为()21.21.1.1.DCBA例题3:r是相关系数,则下列命题正确的是:(1)]75.0,1[r时,两个变量负相关很强;(2)]1,75.0[r时,两个变量正相关很强;(3))75.0,3.0[]3.0,75.0(或r时,两个变量相关性一般;(4)(4)1.0r时,两个变量相关性很弱。3、散点图:初步判断两个变量的相关关系。例题4:在画两个变量的散点图时,下列叙述正确的是()A.预报变量在x轴上,解释变量在y轴上;B.解释变量在x轴上,预报变量在y轴上;C.可以选择两个变量中的任意一个变量在x轴上;D.可以选择两个变量中的任意一个变量在y轴上;例题5:散点图在回归分析过程中的作用是()A.查找个体个数B.比较个体数据的大小C.研究个体分类D.粗略判断变量是否线性相关二、线性回归方程:1、回归方程:axby???其中2121121)())((?xnxyxnyxxxyyxxbniiniiiniiniii,xbya??(代入样本点的中心)例题1:设),(),,(),,(2211nnyxyxyx是变量nyx的和个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(过一、二、四象限),以下结论正确的是()A.直线l过点),(yxB.当n为偶数时,分布在l两侧的样本点的个数一定相同C.的和yx相关系数在0到1之间D.的和yx相关系数为直线l的斜率例题2:工人月工资y(元)依劳动生产率x(千元)变化的回归直线方程为xy9060?,下列判断正确的是()A.劳动生产率为1000元时,工资为150元;B.劳动生产率提高1000元时,工资平均提高150元;C.劳动生产率提高1000元时,工资平均提高90元;D.劳动生产率为1000元时,工资为90元;例题3:设某大学的女生体重)(kgy与身高)(cmx具有线性相关关系,根据一组样本数据)2,1)(,(niyxii,用最小二乘法建立的回归方程为71.8585.0?xy,则不正确的是()A.y与x具有正的线性相关关系;B.回归直线过样本点的中心),(yxC.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg例题4:为了了解儿子的身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高174176176176178儿子身高175175176177177则y对x的线性回归方程为()A.1xyB.1xyC.xy2188D.176y2、残差:(1)残差图:横坐标为样本编号,纵坐标为每个编号样本对应的残差。(2)残差图呈带状分布在横轴附近,越窄模型拟合精度越高。(3)残差平方和niiiyy12)?(越小,模型拟合精度越高。3、相关指数:niiniiiyyyyR12122)()?(1(1)其中:niiiyy12)?(为残差平方和;niiyy12)(为总偏差平方和。(2))1,0(2R,越大模型拟合精度越高。例题5:下列说法正确的是()(1)残差平方和越小,相关指数2R越小,模型拟合效果越差;(2)残差平方和越大,相关指数2R越大,模型拟合效果越好;(3)残差平方和越小,相关指数2R越大,模型拟合效果越好;(4)残差平方和越大,相关指数2R越小,模型拟合效果越差;A.(1)(2)B.(3)(4)C.(1)(4)D.(2)(3)例题6:关于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定关系,则因变量不能由自变量唯一确定;B.线性相关系数r可以是正的,也可以是负的C.样本点的残差可以是正的,也可以是负的D.相关指数2R可以是正的,也可以是负的例题7:下列命题正确的是()(1)线性相关系数r越大,两个变量的线性相关性越强,反之,线性相关性越弱;(2)残差平方和越小的模型,拟合的效果越好;(3)用相关指数2R来刻画回归效果,2R越小,说明模型的拟合效果越好;(4)随机误差e是衡量预报精确度的一个量,但它是一个不可观测的量;(5)ie?表示相应于点),(iiyx的残差,且0?1niie。A.(1)...