选修1-21.2独立性检验的基本思想及初步应用电白高级中学崔玲金复习•1、回归分析的基本思想和步骤分别是什么?•2、在回归分析中借助什么量来分析统计案例的?探究一:分类变量•1、分类变量的概念:变量的不同取值表示个体所属的不同类别的变量。例如:性别,分男女两类,是否吸烟,分吸烟与不吸烟,国籍,分中国,日本等国。2、你能举出一个分类变量吗?吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)列联表在不吸烟者中患肺癌的比例是在吸烟者中患肺癌的比例是说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大0.54%2.28%1.2×2列联表设A、B为两个变量,每一变量都可以取两个值,得到表格ABB1B2总计A1abA2cd总计n=a+bc+da+cb+da+b+c+d吸烟不吸烟不患肺癌患肺癌2.等高条形图(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.探究:独立性检验H0:吸烟和患肺癌之间没有关系←→H1:吸烟和患肺癌之间有关系通过数据分析,得到结论是:吸烟与患肺癌有关结论的可靠程度如何?用A表示“吸烟”,B表示“患肺癌”则H0:吸烟和患肺癌之间没有关系“吸烟”与“患肺癌”独立,即A与B独立P(AB)=P(A)P(B)等价于等价于吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d用的大小可判断变量A、B是否有关联。2K22()K()()()()nadbcabcdacbd问题1:统计量有什么作用?2K反证法假设检验要证明结论A备择假设H1在A不成立的前提下进行推理在H1不成立的条件下,即H0成立的条件下进行推理推出矛盾,意味着结论A成立推出有利于H1成立的小概率事件(概率不超过a的事件)发生,意味着H1成立的可能性(可能性为(1-a))很大没有找到矛盾,不能对A下任何结论,即反证法不成功推出有利于H1成立的小概率事件不发生,接受原假设问题2:根据K2的值怎样检验独立性?答:当K2≤2.706时,没有充分的把握判断变量A、B有关联;当K2>2.706时,有的把握判定变量A、B有关联;90%当K2>3.841时,有的把握判定变量A、B有关联;95%当K2>6.635时,有的把握判定变量A、B有关联;99%P(K2>K0)0.500.400.250.150.100.050.0250.0100.0050.001K00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828分析:根据实际问题的需要确定容许推断”两个分类变量有关系“犯错误概率的上界a,然后查表确定临界值k0探究点二独立性检验问题独立性检验问题的基本步骤有哪几步?2k答(1)计算的观测值,2k(2)得出的观测值和临界值比较;(3)下结论,2k小结:通过2X2列联表计算的观测值,然后和临界值对照判断两个事件是否独立,这种方法在各种统计问题中应用广泛。1、对分类X和Y的统计量K2的值说法正确的是()A.K2越大,“X和Y有关系”的把握性越小BK2越小,“X和Y有关系”的把握性越小。CK2越接近于0,“X和Y无关系”的把握性越小。D.K2越接近于0,“X和Y无关系”的把握性越大。B解析:K2越大,X与Y越不独立,所以关联越大;相反,K2越小,关联越小。2.如果有的把握认为X与Y有关系,那么K2满足()•K2>6.635B.K2≥5.024C.K2≥7.879D.K2>3.84199%A解析:当K2>6.635时,有以上的把握认为X与Y有关系。99%知识体验3(例1)、在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?解:根据题目所给的数据得到如下列联表患心脏病患其它病总计禿顶214175389不禿顶4515971048总计6657721437从图中可以看出,禿顶样本中患心脏病的频率明显高于不禿顶样本中患心脏病的频率。因此可以认为禿顶与患心脏病有关系。根据列联表中的数据,得到不禿顶禿顶不患心脏病患心脏病0.550.431因此,在犯错误的概率不超过0.010的前提下,认为禿顶与患心脏病有关系...