电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

高二数学:1.1(独立性检验(1))课件苏教版 课件VIP免费

高二数学:1.1(独立性检验(1))课件苏教版 课件_第1页
1/16
高二数学:1.1(独立性检验(1))课件苏教版 课件_第2页
2/16
高二数学:1.1(独立性检验(1))课件苏教版 课件_第3页
3/16
某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人,调查结果是:吸烟的220人中37人患病,183人不患病;不吸烟的295人中21人患病,274人不患病。根据这些数据能否断定:患病与吸烟有关吗?患病不患病总计吸烟37183220不吸烟21274295总计58457515为了研究这个问题,我们将上述问题用下表表示:2×2列联表注:什么叫列联表?列联表:列出两个分类变量的频数统计表分类变量:变量的不同“值”表示个体所属的不同类别,这样的变量称为分类变量.注:分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别如性别变量,只取男、女两个值,商品的等级变量只取一级、二级,等等.性别有两种:性别变量,只取男、女两个值男、女患病不患病总计吸烟37183220不吸烟21274295总计58457515为了研究这个问题,我们将上述问题用下表表示:2×2列联表在不吸烟者中患病的比重是在吸烟者中患病的比重是21/295≈7.12%37/220≈16.82%上述结论能说明吸烟与患病有关吗?能有多大把握认为吸烟与患病有关呢?患病不患病总计吸烟aabba+ba+b不吸烟ccddc+dc+d总计a+ca+cb+db+da+b+ca+b+c+d+d如果“吸烟与患病没有关系””,则在吸烟者中不患病的比例应该与不吸烟者中相应的比例差不多,即0acacdcabadbcabcd因此|ad-bcad-bc|越小,说明吸烟与患病之间关系越弱;|ad-bcad-bc|越大,说明吸烟与患病之间关系越强.为便于研究,用字母代替数据,得2×2列联表患病不患病总计吸烟aabba+ba+b不吸烟ccddc+dc+d总计a+ca+cb+db+da+b+ca+b+c+d+d列出2×2列联表我们不妨作出相反的假设,H0:吸烟和患病之间没有关系即H0:P(AB)=P(A)P(B)其中A为某人吸烟,B为某人患病设n=a+b+c+d为样本量则P(A)nbaP(B)nca故P(AB)ncanba吸烟且患病人数ncanbanABPn)(吸烟但未患病人数ndbnbanBAPn)(不吸烟但患病人数ncandcnBAPn)(不吸烟且未患病人数怎样描述实际观测值与预期值的差异呢?统计学中,为度量观测值与预期值的差值皮尔逊(K.Pearson)引进卡方统计量ncanbanncanbana22)(ndbnbanndbnbanb2)(ncandcnncandcnc2)(ndbndcnndbndcnd2)())()()(()(22dcbadbcabcadn化简得2(2观测值预期值)用卡方统计量:预期值来刻画实际观测值与估计值的差异.即卡尔.皮尔逊——英国著名的应用数学家、生物统计学家、优生学家和科学哲学家.若H0成立,即“吸烟与患病没有关系””,则χ2应很小独立性检验通过公式计算863.1145758295220183212743751522H0:吸烟和患病之间没有关系解:患病患病不患病不患病总计总计吸烟吸烟3737183183220220不吸烟不吸烟2121274274295295总计总计5858457457515515这个值是不是很大呢?在H0成立的情况下,统计学家估算出如下的概率:H0成立可能性只有1%,因此我们有99%的把握认为H0不成立,即有99%的把握认为“吸烟与患病有关系”01.0)635.6(2P即在H0成立的情况下,的值大于6.635的概率非常小,近似于0.01.2P(χ2≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828这种利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.2独立性检验的思想类似于数学上的反证法.要确认“两个分类变量有关系”这一结论成立,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量应该很小,如果由观测数据计算得到的的观测值很大,则在一定程度上说明假设不合理.22独立性检验第一步:H0:吸烟和患病之间没有关系通过数据和图表分析,得到结论是:吸烟与患病有关结论的可靠程度如何?患病不患病总计吸烟aba+b不吸烟cdc+d总计a+cb+da+b+c+d第二步:列出2×2列联表用χ2统计量研究这类问题的方法步骤第三步:引入一个随机变量:卡方统计量第四步:查对临界值表,作出判断。dcban其中...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

高二数学:1.1(独立性检验(1))课件苏教版 课件

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部