变量间的相关关系、回归分析及独立性检验【知识精讲】1.会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.掌握独立检验(只要求 2×2 列联表)的基本思想、方法简单应用.4. 掌握假设检验和聚类分析的基本思想、方法简单应用.【基础梳理】1.相关关系的量:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.2.回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析.3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.4.正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.6.相关系数:r=叫做变量 y 与 x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.7.相关系数的性质:|r|≤1,且|r|越接近 1,相关程度越大;且|r|越接近 0,相关程度越小.8.独立性检验:一般地,假设有两个分类变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为: 2×2 列联表若要推断的论述为 H1:X 与 Y 有关系,可以按如下步骤判断结论 H1 成立的可能性:(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.① 在三维柱形图中,主对角线上两个柱形高度的乘积 ad 与副对角线上的两个柱形高度的乘积 bc 相差越大,H1 成立的可能性就越大.② 在二维条形图中,可以估计满足条件 X=x1 的个体中具有 Y=y1 的个体所占的比例 ,也可以估计满足条件 X=x2 的个体中具有 Y=y2 的个体所占的比例.“两个比例的值相差越大,H1 成立的可能性就越大.”(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:① 根据实际问题需要的可信程度确定临界值 k0;② 利用公式 K2= ,由观测数据计算得到随机变量 K2的观测值k;③ 如果 k>k0,就以(1-P(K2≥k0))×100%的把握认为“X 与 Y 有关系”;否则就说样本观测数据没有提供“X 与 Y 有关系”的充分证据.【要点解读】要点七 相关关系的判断【例 7】山东鲁洁棉业公司的科研人员在 7 块并排、形状大小相同的...