第四节变量间的相关关系、统计案例1.两个变量的线性相关(1)在散点图中,点散布在从____________到_________的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)在散点图中,点散布在从_________到_________的区域,两个变量的这种相关关系称为负相关.(3)如果散点图中点的分布从整体上看大致在______________,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.左下角右上角左上角右下角一条直线附近2.回归方程(1)最小二乘法:使得样本数据的点到回归直线的_____________和最小的方法叫最小二乘法.距离的平方(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1)、(x2,y2),…,(xn,yn).其回归方程为y^=b^x+a^,则其中___________称为样本点的中心.4.独立性检验(1)利用随机变量______来判断“两个分类变量__________”的方法称为独立性检验.3.残差分析(1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn),它们的随机误差为ei=yi-bxi-a,i=1,2,…,n,其估计值为e^i=yi-y^i=yi-b^xi-a^,i=1,2,…,n
e^i称为相应于点(xi,yi)的残差.(2)残差平方和为∑ni=1(yi-y^i)2
(3)相关指数:R2=____________________.K2有关系(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=______________________________________