第 3 章 统计案例章末总结—知识点一 独立性检验一般地,假设有两个分类变量 X 和 Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为2×2 列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d若要推断的论述为 H1:“X 与 Y 有关系”,可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体做法是:根据观测数据计算由公式给出的检验随机变量 χ2的值,其值越大,说明“X 与 Y 有关系”成立可能性越大.当得到的观测数据 a,b,c,d 都不小于 5 时,可以通过两个临界值来确定结论“X 与 Y 有关系”的可信程度.① 若 χ2>3.841,则有 95%的把握认为“X 与 Y 有关系”;② 若 χ2>6.635,则有 99%的把握认为“X 与 Y 有关系”;③ 若 χ2≤3.841,则认为“X 与 Y 无关系”.例 1 有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠不冷漠合计多看电视6842110少看电视203858合计8880168试问:多看电视与人变冷漠有关吗?1知识点二 回归分析回归分析是指对具有相关关系的两个变量进行统计分析的一种常用方法:可以利用散点图观察,代入公式求出回归直线方程,然后利用相关系数 r 进行相关性检验.例 2 针对某工厂某产品产量与单位成本的资料进行线性回归分析:月份产量(千件)x单位成本(元/件)yx2xy127341462372921634711628443739219546916276656825340合计21426791 481例 3 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,2必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量 x 与冶炼时间 y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:x (0.01%)104180190177147134150191204121y (分钟)100200210185155135170205235125(1)y 与 x 是否具有线性相关关系?(2)如果 y 与 x 具有线性相关关系,求回归直线方程.(3)预测当钢水含碳量为 160 个 0.01%时,应冶炼多少分钟?章末总结答案3重点解读例 1 解 由公式得 χ2=≈11.377>6.635,所以我们有 99%的把握说,多看电视与人变冷漠有关.例 2 解 设回归直线方程为y =b x+a .=3.5,=71,∑x=79,∑xiyi=1 481,所以代入公式,b ==≈-1.82a =71-(-1.82)×3.5≈77.37,故回归直线方程为y =77.37-1.82x;由回归系数b 的意义可知:产量每增加 1 ...