第三节变量间的相关关系、统计案例[考情展望]1
考查独立性检验的基本思想,两个临界值的理解及应用
考查回归分样的基本思想及回归直线方程的计算应用
多以选择题、填空题形式进行考查.一、两个变量的线性相关1.在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.2.在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.3.如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.二、回归方程1.最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.2.回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn).其回归方程为y=bx+a,则其中(,)称为样本点的中心.三、残差分析1.残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn),它们的随机误差为ei=yi-bxi-a,i=1,2,…,n,其估计值为ei=yi-yi=yi-bxi-a,i=1,2,…,n
ei称为相应于点(xi,yi)的残差.2.残差平方和为∑(yi-yi)2
3.相关指数:R2=1-
四、独立性检验1.利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=,其中n=a+b+c+d为样本容量.1.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A
y=-10x+200B
y=10x+200C
y=-10x-200D