第 3 讲 变量间的相关关系与统计案例[考纲解读] 1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系;根据最小二乘法求出回归直线方程.(重点)2.了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其初步应用.[考向预测] 从近三年高考情况来看,本讲是高考中的一个热点考查内容.预测 2021 年将会考查:①回归直线方程的判断、求解及相关系数的意义,并用其解决实际问题;②独立性检验思想在实际问题中的应用.试题以解答题的形式呈现,难度为中等.此外,也可能出现在客观题中,此时试题难度不大,属中、低档题型.1.相关关系与回归方程(1)相关关系的分类① 正相关:从散点图上看,点散布在从□左下角到□右上角的区域内,如图1;② 负相关:从散点图上看,点散布在从□左上角到□右下角的区域内,如图2.(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在□一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做□回归直线.(3)回归方程① 最小二乘法:使得样本数据的点到回归直线的□距离的平方和最小的方法叫做最小二乘法.② 回归方程:两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程为y=bx+a,则b==,a=y-b x.其中,b是回归方程的□斜率,a是在 y 轴上的□截距,x=∑xi,y=∑yi,□( x , y ) 称为样本点的中心.说明:回归直线y=bx+a必过样本点的中心(x,y),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.(4)样本相关系数r=,用它来衡量两个变量间的线性相关关系.① 当 r>0 时,表明两个变量□正相关;② 当 r<0 时,表明两个变量□负相关;③r 的绝对值越接近 1,表明两个变量的线性相关性□ 越强 ;r 的绝对值接近于 0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75 时,认为两个变量有很强的线性相关关系.2.残差分析(1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn),它们的随机误差为 ei=yi-bxi-a,i=1,2,…,n,其估计值为ei=yi-yi=yi-bxi-a,i=1,2,…,n,ei称为相应于点(xi,yi)的残差.(2)残差平方和为∑ (yi-yi)2.(3)相关指数:R2=1-□.3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的□不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的□频数表,称为列联表.假设有两个分类变量 X 和 Y,它...