电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

第3章 四格表VIP免费

第3章 四格表_第1页
1/59
第3章 四格表_第2页
2/59
第3章 四格表_第3页
3/59
第三章四格表——2×2列联表什么是四格表【例3.1】为了解吸烟与肺癌的关系,选择63个肺癌患者和43个与肺癌患者年龄、性别和其他属性类似的健康人(对照组)进行研究,调查结果见表3.1。问总体中肺癌患者吸烟的比例是否比健康人吸烟的比例高?表3.1对肺癌患者和对照组的调查结果吸烟不吸烟吸烟比例%肺癌患者对照组603321195.274.4什么是四格表上述检验问题可以一般化为:其数据结构关系包括五个等式。从略有B没有B合计有A没有A合计11n12n21n22n1n2n1n2nn四格表的抽样方式根据四格表的边缘分布是否给定,可能的抽样方式有以下四种:1、单侧给定,如n1+和n2+给定,则在四格中有两个随机变量,服从二项分布;如:63个肺癌患者和43个对照组,属于行边缘分布给定的情况2、总样本容量n给定,则有三个随机变量,n11,n12,n21,n22服从多项分布;如:Mendel豌豆实验,属于n给定的情况四格表的抽样方式3、都不给定时,n11,n12,n21,n22都是随机变量,通常假定它们服从Poisson分布如:某商店在某一天可能来的顾客数未知,顾客的性别以及有没有购买的情况,存在4个随机变量男女合计购买不购买合计11n12n21n22n1n2n1n2nn四格表的抽样方式4、两侧都给定时,只有一个是随机变量,它服从超几何分布。如:假设100件产品中有8件次品,随机抽5件加以检验,问有多少件次品?对不同抽样方式下得到的四格表,其数据分析方法也有可能不同。抽取未抽取合计不合格合格892合计59510011n12n21n22n属性之间独立与不相关两个相互独立的随机变量一定不相关,但不相关不一定独立。这里相关指线性相关四格表中属性A与B相互独立等价于不相关。根据前面的频数分布表可以得到概率四格表:XY有B(b1)没有B(b2)合计有A(a1)没有A(a2)合计11p12p21p22p1p2p1p2p1属性之间独立与不相关若以下等式成立,则称属性A和B相互独立。该式包括:且有:,1,2ijijpppij,1111121221212222pppppppppppp1111121221212222pppppppppppp属性之间独立与不相关在四格表中,独立等价于不相关。可以通过考察随机变量X(属性A)与Y(属性B)的协方差知:其中,a1,a2和b1,b2分别是属性A和B的分类(取值)当A与B不相关时,有:可见,四格表中属性A与B无关也就是相互独立。12121111(,)()()()()()()CovXYEXYEXEYaabbppp111100ijijpppppp属性之间独立与不相关在协方差的基础上,不难计算出随机变量X(A)和Y(B)的方差,并得到它们的相关系数。各自方差分别为:则相关系数:可见,四格表中属性间的关系与属性的赋值无关。2121221212()()()()DXaappDYbbpp11111212ppprpppp单侧给定的四格表的检验单侧给定时四格表中仅有两个随机变量,且服从二项分布如:当n1+和n2+给定时,n11和n21分别服从:B(n1+,p1)和B(n2+,p2),其中,上例肺癌患者吸烟比例是否比对照组高,也即要求验证假设p1=p2还是p1>p2.2111211211112111112pppppppppppppp12(|),(|)pPBApPBA单侧给定的四格表的检验可见,原假设成立时,实际上是检验属性A与B相互独立或不相关。因此,四格表的检验有以下三种情况:单侧给定的四格表检验,其实就是两总体的比例差的检验,区别仅在于使用的值不同,一个是样本比例,一个是观测频数。原假设H0备择假设H1有方向检验p1=p2p1>p2p1=p2p1

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

第3章 四格表

确认删除?
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群