1112-无 序 分 类 资 料 的 统 计 分 析( χ2检 验 )医学统计学2009年2• 无序多分类资料(nominal data)• 如血型可以分为A、B、AB和O型;又如慢性气管炎可以分为单纯型、喘息型、单纯型合并肺气肿和喘息型合并肺气肿。• 观察可能的结果只有若干个并且这种观察结果在背景意义上没有程度或等级的含义,通常用变量取值为1,2,…,m对应表示相应m个无序分类的属性或类别,故这种变量的取值没有大小的背景意义,仅是指示不同类别的作用。3• 频数分布拟合优度的χ2检验• 拟合优度检验不针对具体参数,而是针对分布的类型,需要对样本所代表的总体分布进行推断,是推断单样本的k组内频数的分布与某一理论分布是否相同的一种假设检验方法。• “拟合优度”意指样本实际频数“拟合”期望(理论)频数的优劣程度。皮尔逊(K Pearson)早在1900年提出了一个用于检验“总体具有某种分布”的假设检验方法,这就是著名的Pearson χ2检验。4• 统计量,自由度v=k-1-g式中A:实际频数T:期望(理论)频数k:组数g:以样本数据估计参数的个数• H0:样本资料服从某一概率分布(记为F(x)),H1:样本资料不服从F(x)。• 如果样本含量较大,当H0为真时,检验统计量χ2服从自由度v=k-1-g的χ2分布,即当检验统计量χ2大于χ2α,v时,可以拒绝H0,并且认为样本所在总体分布与F(x)分布不同。22()A TTχ−=∑5• 例11-1 根据某地区的血型普查结果可知,该地区人群中血型为O的占30%,血型为A的占25%,血型为B的占35%,血型为AB的占10%。研究者在邻近该地区的一个山区人群中进行一个血型的流行病调查,在该山区人群中随机抽样调查了200人,检测这些对象的血型,表11-1给出了血型检测的结果。问该山区人群与这个地区人群的血型分布是否一致?6• 欲回答该山区人群与这个地区人群的血型分布是否一致,即山区抽样对象的血型频数出现机会是否与该地区人群的血型分布相符合,需进行拟合优度的χ2检验。1.建立检验假设,确定检验水准H0:该山区人群与这个地区人群的血型分布是一致的H1:该山区人群与这个地区人群的血型分布不一致α=0.05272.求出H0为真时各组的理论频数• 该地血型分布是普查所得,作为总体血型分布。• H0为真时,该地区人群与山区人群的O的频率均是30%,A的频率均是25%,B的频率均是35%,AB均是10%。• 对于山区抽样人数为200人,理论上O的人数应为200×30%=60人,A的人数应为200×25%=50人,B的人数应为200×35%=...