电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

3.1独立性检验-(2)VIP免费

3.1独立性检验-(2)_第1页
1/17
3.1独立性检验-(2)_第2页
2/17
3.1独立性检验-(2)_第3页
3/17
皮尔逊(KarlPearson,1857—1936),英国统计学家.现代统计学的创始人之一,被誉为统计学之父.3.2独立性检验的基本思想及应用有人说:吸烟有害健康!吸烟会引发肺癌.另一些人说:吸烟不影响健康.理由是,有的吸烟老人却很长寿。这两种观点哪个正确呢?171322232718对于性别变量,其取值为男和女两种,这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.列联表:列出两个个分类变量的频数表为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)表3-7吸烟与患肺癌列联表那么吸烟是否对患肺癌有影响?因此,直观上得到结论:吸烟者和不吸烟者患肺癌的可能性存在差异。在不吸烟者中患肺癌的比例是在吸烟者中患肺癌的比例是0.54%2.28%9965919874总计2148492099吸烟7817427775不吸烟总计患肺癌不患肺癌列联表:两个分类变量的频数表探究:0%10%20%30%40%50%60%70%80%90%100%不吸烟吸烟患肺癌不患肺癌患肺癌比例不患肺癌比例等高条形图上面我们通过分析数据和图形,得到的直观印象是“吸烟和患肺癌有关”。这一直觉来自于观测数据,即样本。问题是它能够在多大程度上代表总体呢?能否用数量刻画出有关的程度?H0:吸烟与患肺癌没有关系我们假设看看能推出什么样的结论。不患肺癌(B)患肺癌()总计不吸烟(A)aba+b吸烟()cdc+d总计a+cb+dn=a+b+c+d因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad-bc|越大,说明吸烟与患肺癌之间关系越强。adbc即aa+ba+c≈×nnna+bP(A),na+cP(B),n.aP(AB)n其中为样本容量,即n=a+b+c+d在表中,a恰好为事件AB发生的频数;a+b和a+c恰好分别为事件A和B发生的频数。由于频率接近于概率,所以在H0成立的条件下应该有(a+b+c+d)a(a+b)(a+c),随堂练习2.[2014·江西卷]某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()成绩性别不及格及格总计男61420女102232总计163652视力性别好差总计男41620女122032总计163652智商性别偏高正常总计男81220女82432总计163652阅读量性别丰富不丰富总计男14620女23032总计163652A.成绩B.视力C.智商D.阅读量D为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量若H0成立,即“吸烟与患肺癌没有关系”,则K2应很小.由列联表中数据,利用公式(1)计算得K2的观测值为:22()()()()()nadbcKabcdacbd(1)29965(777549422099)56.632.78172148987491k其中n=a+b+c+d为样本容量.在H0成立的情况下,统计学家估算出如下的概率:2(6.635)0.01PK也就是说,在H0成立的情况下,随机变量K2超过6.635的概率约为0.01,是一个小概率事件.现在K2的观测值为56.632,远远大于6.635,所以有理由断定H0不成立,即认为“吸烟与患肺癌有关系”但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系”.合作预习合作运用当堂作业合作指导结束教学教学新课根据观测数据计算随机变量K2的值k,其值越大,说明“X与Y有关系”成立的可能性越大。可以通过查阅下表(表3-11)来确定断言“X与Y有关系”的可信程度。10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445k0.0010.0050.0100.0250.050.100.150.250.400.502()PKk例如:(1)如果k>10.828,就有99.9%的把握认为“X与Y有关系”;(2)如果k>6.635,就有99%的把握认为“X与Y有关系”;(3)如果k>2.706,就有90%的把握认为“X与Y有关系”;(4)如果k<=2.706,就认为没有充分的证据显示“X与Y有关系”。小结:独立性检验:第一步:列联表第二步:假设两个分类变量X与Y没有关系第三步:计算随机变量的观测值k2K第四步:如果,就推断X与Y有关系,这种推断犯错误的概率不超过a;否则,认为在犯错误概率不超过a的前提下不能推断X与Y有关系;0kk课堂练习C课堂练习解:根据题目中的数据计算所以有99%的把握认为两种生产方式的效率有差异合作预习合作运用当堂作业合作指导结束教学教学新课课堂总结:1.知识结构图两个分类变量相关性检验的方法分...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

3.1独立性检验-(2)

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部