第三章 统计案例 1 本章知识大串烧一、独立性检验的基本思想通过分析数据与图形,得出的估计是粗略的,因为我们说的“大得多”、“小得多”,到底是有多大的差距?也就是说得到的结论是直观上的印象,其实与是否有关还是有较大的差距的.下面从理论上说明两个变量是否有关,请同学们从中体会其思想方法.1.基本思想与图形的联系假设两个变量是无关的,可知如下的比应差不多,即:≈⇒|ad-bc|=0.构造统计量 χ2=(其中 n=a+b+c+d)(此公式如何记忆,其特点是什么?结合 2×2 列联表理解),显然所构造的统计量与|ad-bc|的大小具有一致性.2.独立性检验的思想方法如果 χ2的值较大,说明其发生(无关系)的概率很小,此时不接受假设,也就是两个变量是有关系的(称小概率事件发生);如果 χ2的值较小,此时接受假设,说明两分类变量是无关系的.其思想方法类似于数学上的反证法.3.得到 χ2的值常与以下几个临界值加以比较:如果 χ2>2.706,就有 90%的把握认为Ⅰ和Ⅱ有关系;如果 χ2>3.841,就有 95%的把握认为Ⅰ和Ⅱ有关系;如果 χ2>6.635,就有 99%的把握认为Ⅰ和Ⅱ有关系;如果 χ2>10.828,就有99.9%的把握认为Ⅰ和Ⅱ有关系;如果 χ2≤2.706,就认为没有充分的证据显示Ⅰ和Ⅱ有关系.像这种利用统计量 χ2来确定在多大程度上可以认为“两个变量有关系”的方法称为两个变量的独立性检验.二、回归分析1.线性回归方程y =b x+a ,其中:b ==,a =-b .(注:b =主要方便计算,其中(xi,yi)为样本数据,(,)为样本点的中心)公式作用:通过刻画线性相关的两变量之间的关系,估计和分析数据的情况,解释一些实际问题,以及数据的变化趋势.2.样本相关系数的具体计算公式r==公式作用:反映两个变量之间线性相关关系的强弱.当 r 的绝对值接近 1 时,表明两个变量的线性相关性越强;当 r 的绝对值接近 0 时,表明两个变量之间几乎不存在线性相关关系.规定当|r|>r0.05时,认为两个变量有很强的线性相关关系.公式联系:(1)由于分子与回归方程中的斜率b 的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当 r>0 时,两个变量正相关;当 r<0 时,两个变量负相关.(2)常配合散点图判断两个随机变量是否线性相关.散点图是从形上进行粗略地分析判断,这个判断是可行的、可靠的,也是进行线性回归分析的基础,否则回归方程失效;它形象直观地反映了数据点的分布情况.相关系数 r 是从...