第 7 讲 统计与统计案例、分布列及期望与方差调研一 统计与统计案例■备考工具——————————————1.分层抽样和系统抽样的计算(1)系统抽样:总体容量为 N,样本容量为 n,则要将总体均分成 n 组,每组个(有零头时要先去掉).若第一组抽到编号为 k 的个体,则以后各组中抽取的个体编号依次为 k+,…,k+(n-1).(2)分层抽样:按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比.2.提取频率分布直方图中的数据(1)组距、频率:频率分布直方图中每个矩形的宽表示的组距,高表示,面积表示该组数据的频率,各个矩形的面积之和为 1;(2)众数:最高小长方形底边中心的横坐标;(3)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(4)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中心的横坐标之和;(5)参数:若纵轴上存在参数,则根据所有小长方形的面积之和为 1,列方程即可求得参数值.3.回归直线方程y=bx+a,其中b=.a=-b,(,)称为样本点的中心.4.相关系数:r=.主要用于相关量的显著性检验,以衡量它们之间的线性相关程度.当 r>0 时,表示两个变量正相关;当 r<0 时,表示两个变量负相关.|r|越接近 1,表明两个变量的线性相关性越强;当|r|接近 0 时,表明两个变量间几乎不存在线性相关关系.5.列联表列出两个分类变量的频数表,称为列联表.假设有两个分类变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d可构造一个随机变量K2=,其中 n=a+b+c+d 为样本容量.6.独立性检验的方法(1)构造 2×2 列联表;(2)计算 K2;(3)查表确定有多大的把握判定两个变量有关联.注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的 k 值与求得的 K2相比较.另外,表中第一行数据表示两个变量没有关联的可能性 p,所以其有关联的可能性为 1-p.7.(1)残差:ei=yi-yi称为相应于点(xi,yi)的残差,残差平方和为(yi-yi)2.(2)相关指数 R2=1-.R2越大,说明残差平方和越小,即模型的拟合效果越好;R2越小计,残差平方和越大,即模型的拟合效果越差.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近于 1,表示回归的效果越好.8.与平方数和方差有关的结论(1)若 x1,x2...