第十章 统计、统计案例10
3 统计案例【高考目标定位】一、考纲点击1
了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用;2
了解回归分析的基本思想、方法及其简单应用
二、热点提示1
本部分主要内容是变量的相关性及其几种常见的统计方法
在高考中主要是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来了解一些基本的统计思想;2
本部分在高考中多为选择、填空题,也有可能出现解答题,都为中低档题
【考纲知识梳理】1
回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;(2)随机误差:线性回归模型用表示,其中为模型的未知数,称为随机误差
(3)样本点的中心在具有线性相关关系的数据中,回归方程的截距和斜率的最小二乘估计公式分别为:其中称为样本点的中心
(4)相关系数①② 当时,表明两个变量正相关;当时,表明两个变量负相关
的绝对值越接近于 0 时,表明两个变量之间几乎不存在线性相关关系
75 时,认为两个变量有很强的线性相关性
残差分析(1)总偏差平方和把每个效应(观测值减去总的平均值)的平方加起来即:(2)残差数据点和它回归直线上相应位置的差异是随机误差的效应,称为残差
(3)残差平方和
(4)相关指数的值越大,说明残差平方和越小,也就是说模型的拟合效果越好
在线性回归模型中, 表示解释变量对预报变量变化的贡献率, 越接近于 1,表示回归的效果越好
独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量
(2)列联表:列出两个分类变量的频数表,称为列联表
假设有两个分类变量 X 和 Y,它们的可能取值分别为,其样本频数列联表(称为 2×2 列联表)为2×2 列联表总计总计构造一个随机变量,其中为样本容量
(3)独立性检验利用随机变量来确定是否能以一定把握认为“两个分类变量有关