第 3 节 变量间的相关关系与统计案例最新考纲 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用.知 识 梳 理1.相关关系与回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.2.线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据: (x1,y1),(x2,y2),…,(xn,yn),其回归方程为y = b x + a __,则b==,a=y-bx.其中,b是回归方程的斜率,a是在 y 轴上的截距.回归直线一定过样本点的中心(x,y).3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中( x , y ) 称为样本点的中心.(3)相关系数当 r>0 时,表明两个变量正相关;当 r<0 时,表明两个变量负相关.r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于 0.75 时,认为两个变量有很强的线性相关性.(4)相关指数:R2=1 - .其中∑ (yi-yi)2是残差平方和,其值越小,则 R2越大(接近 1),模型的拟合效果越好.4.独立性检验(1)利用随机变量 K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2 列联表)为y1y2总计x1aba + b x2cdc+d总计a+cb + d a+b+c+d则随机变量 K2=,其中 n=a + b + c + d 为样本容量.[常用结论与微点提醒]1.求解回归方程的关键是确定回...