第 3 讲 变量间的相关关系、统计案例一、知识梳理1.相关性(1)线性相关若两个变量 x 和 y 的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的,此时可用一条直线来拟合.(2)非线性相关若两个变量 x 和 y 的散点图中,所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关,此时可用一条曲线来拟合.(3)不相关如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.2.最小二乘法(1)最小二乘法如果有 n 个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线 y=a+bx 的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2,使得上式达到最小值的直线 y=a+bx 即为所求直线,这种方法称为最小二乘法.(2)线性回归方程线性回归方程为 y=bx+a,其中 b==,a=y - b x .3.相关系数 r (1)r==.(2)当 r>0 时,称两个变量正相关.当 r<0 时,称两个变量负相关.当 r=0 时,称两个变量线性不相关.r 的绝对值越接近于 1,表明两个变量之间的线性相关程度越高;r 的绝对值越接近0,表明两个变量之间的线性相关程度越低.4.独立性检验设 A,B 为两个变量,每一个变量都可以取两个值,变量 A:A1,A2=A1;变量 B:B1,B2=B1,通过观察得到下表所示数据:BB1B2总 计A A1aba+bA2cdc+d总 计a+cb+dn=a+b+c+d 则 χ2=,用它的大小来检验变量之间是否独立.① 当 χ2≤2.706 时,没有充分的证据判定变量 A,B 有关联,可以认为变量 A,B 是没有关联的;② 当 χ2>2.706 时,有 90%的把握判定变量 A,B 有关联;③ 当 χ2>3.841 时,有 95%的把握判定变量 A,B 有关联;④ 当 χ2>6.635 时,有 99%的把握判定变量 A,B 有关联.常用结论1.求解线性回归方程的关键是确定回归系数 a,b,应充分利用线性回归直线过样本中心点(x,y).2.根据 χ2的值可以判断两个分类变量有关的可信程度,若 χ2越大,则两分类变量有关的把握越大.3.根据线性回归方程计算的 y 值,仅是一个预报值,不是真实发生的值.二、教材衍化1.为调查中学生近视情况,测得某校男生 150 名中有 80 名近视,在 140 名女生中有70 名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( )A.回归分析 B.均值与方差C.独立性检验 D.概率解析:选 C.“近视”与“...