(会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系/了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程/了解独立检验(只要求2×2列联表)的基本思想、方法简单应用/了解假设检验的基本思想、方法简单应用/了解聚类分析的基本思想、方法简单应用)9.3变量间的相关关系、回归分析及独立性检验1.相关关系的量:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.2.回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析.3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.4.正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.5.回归直线:设所求的直线方程为,其中求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.6.相关系数:r=叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.7.相关系数的性质:|r|≤1,且|r|越接近1,相关程度越大;且|r|越接近0,相关程度越小.8.独立性检验:一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:2×2列联表若要推断的论述为H1:X与Y有关系,可以按如下步骤判断结论H1成立的可能性:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大.②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例,也可以估计满足条件X=x2的个体中具有Y=y2的个体所占的比例.“两个比例的值相差越大,H1成立的可能性就越大.”(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:①根据实际问题需要的可信程度确定临界值k0;②利用公式K2=,由观测数据计算得到随机变量K2的观测值k;③如果k>k0,就以(1-P(K2≥k0))×100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据.1.在对两个变量x,y进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可靠性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是()A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①答案:D2.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是()A.由样本数据得到的回归方程=bx+a必过样本中心()B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相关关系答案:C3.(2009·宁夏、海南)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:由图(1)可知,各点整体呈递减趋势,x与y负相关,由图(2)可知,各点整体呈递增趋势,u与v正相关.答案:C4.下面是一个2×2列联表则表中a、b处的值分别为()A.94,96B.52,50C.52,54D.54,52答案:Cy1y2总计x1a2173x222527总计b46判断两个变量正相关还是负相关,有三种方法:1.利用散点图;2.利用相关系数r的符号;当r>0时,正相关;r<0时,负相关;3.在已知两变量线性相关时,也可以利用回归方程=a+bx.当b>0时,=a+bx是增函数,两变量是正相关,当b<0时,=a+bx是减函数,两变量...