第二章统计2.3.2两个变量的线性相关问题提出1.两个变量之间的相关关系的含义如何?成正相关和负相关的两个相关变量的散点图分别有什么特点?自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系.正相关的散点图中的点散布在从左下角到右上角的区域,负相关的散点图中的点散布在从左上角到右下角的区域2.观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?对此,我们从理论上作些研究.051015202530354020253035404550556065年龄脂肪含量思考1:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?051015202530354020253035404550556065年龄脂肪含量这些点大致分布在一条直线附近.思考2:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.051015202530354020253035404550556065年龄脂肪含量思考3:对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?051015202530354020253035404550556065年龄脂肪含量一条知识探究(二):回归方程在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.思考1:回归直线与散点图中各点的位置应具有怎样的关系?整体上最接近051015202530354020253035404550556065年龄脂肪含量(x1,y1)(x2,y2)(xi,yi)(xn,yn)可以用或,其中.||iiyyÙ-2()iiyyÙ-iiybxaÙ=+思考2:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为可以用哪些数量关系来刻画各样本点与回归直线的接近程度?ybxaÙ=+思考3:为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?21ˆ()niiiQyy2221122()()()nnybxaybxaybxa(x1,y1)(x2,y2)(xi,yi)(xn,yn)思考4:根据有关数学原理分析,当时,总体偏差为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.1122211()(),()nniiiiiinniiiixxyyxynxybaybxxxxnx21ˆ()niiiQyy思考5:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为多少?0.5770.448yxÙ=-051015202530354020253035404550556065年龄脂肪含量20.9%小结1.求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均数,xy1niiixy21niix第二步,求和,1122211()(),()nniiiiiinniiiixxyyxynxybaybxxxxnx第三步,计算ybxaÙ=+第四步,写出回归方程