1.1 回归分析自主整理假设样本点为(x1,y1),(x2,y2),…,(xn,yn),设线性回归方程为 y=a+bx,使这 n 个点与直线y=a+bx 的_____________最小,即使得 Q(a,b)=_____________达到最小.利用最小二乘法的思想求得.当 b=_____________,a=_____________时,Q(a,b)取最小值.高手笔记1.对具有相关关系的两个变量进行统计分析的方法叫回归分析.回归分析是寻找相关关系中非确定性关系的某种确定性.2.如果散点图中点的分布从整体上看大致在一条直线附近,我们称这两个变量之间具有线性相关关系,这条直线叫回归直线,从整体上看各点与此直线的距离平方之和最小,即最贴近已知的数据点,最能代表变量 x 与 y 之间的关系.名师解惑1.相关关系与函数关系有哪些相同点和不同点?剖析:相同点:两者均指两个变量的关系.不同点:(1)函数关系是一种确定的关系,相关关系是一种非确定的关系;(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.如何理解相关关系的不确定性?剖析:教材中利用始祖鸟的 5 个标本求出股骨长度 x 与肱骨长度 y 的回归直线方程为 y=-3.660+1.197x,那么将第 6 个标本中股骨长度 x=50 代入回归直线方程,可以预测第 6 个标本中的肱骨长度的估计值约为 56 cm.是不是当股骨长度 x=50 时,肱骨长度 y 一定为 56 呢?不一定.但如果有大量化石供研究时,股骨长度为 50 cm 的始祖鸟的肱骨的平均值应为 56 cm.讲练互动【例】关于人体的脂肪含量(百分比)和年龄关系的研究中,研究人员获得了一组数据:年龄 x23273941454950脂肪 y9.517.821.225.927.526.328.2年龄 x53545657586061脂肪 y29.630.231.430.833.535.234.6(1)求 y 与 x 之间的回归直线方程;(2)给出 37 岁人的脂肪含量的预测值.分析:两个变量呈现近似的线性关系,可通过公式计算出其线性回归方程,并根据方程求出其预测值.解:设方程为 y=a+bx,根据已知列表为:ixiyixi2xiyi1239.5529218.522717.8729480.633921.21 521826.844125.91 6811 061.954527.52 0251 237.564926.32 4011 288.775028.22 5001 41085329.62 8091 568.895430.22 9161 630.81105631.43 1361 758.4115730.83 2491 755.6125833.53 3641 943136035.23 6002 112146134.63 7212 110.6∑673381.734 18119 403.2由表可得,147.381,14673yxb=2)14673(1434181147.38114673142.19403≈0.5765,a= ...