第三章定性数据的卡方检验在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。机动目录上页下页返回结束H0(无效假设):总体参数没有差别机动目录上页下页返回结束χ2检验用途:分类计数资料的假设检验,检验两个或多个总体率或构成比有无差别。基本思想:实际频数与理论频数的符合程度,即差别是否由抽样误差引起的。检验统计量:)1(~)(2202rKfffeeχ2用来反映各类中实际观测到的实际频数与一定假设下的理论频数的偏离程度.永远是正值.实际频数通过实际观测或实验得到,理论频数要按照统计假设计算出来.第三章第一节机动目录上页下页返回结束卡方拟合性检验第三章第一节机动目录上页下页返回结束卡方拟合性检验一、卡方检验的一般问题卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。理论证明,实际观察次数(fo)与理论次数(fe),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为:机动目录上页下页返回结束)1(~)(2202rKfffeeK为组数,r为待估参数个数.n=1n=4n=10f(y)01357911131517x0.50.40.30.20.1有所改变.2分布的概率密度图形如下:2χ显然分布的概率密度图形随自由度的不同而当fe越大(fe≥5),近似得越好。显然fo与fe相差越大,卡方值就越大;fo与fe相差越小,卡方值就越小;因此它能够用来表示fo与fe相差的程度。机动目录上页下页返回结束拟合性检验自由度的确定与两个因素有关:一是分类的项数,二是在计算理论次数时,所用统计量或约束条件的个数,这两者之差即为自由度。由于一般情况下,计算理论次数时只用到“总数”这一统计量,所以自由度一般是分类的项数减1。拟合性检验的零假设是观测次数与理论次数之间无差异。机动目录上页下页返回结束可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得到的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。二、检验无差假设无差假设:指各项分类的实计数之间没有差异,也就是说各项分类之间的概率相等(均匀分布),因此理论次数完全按概率相等的条件来计算。任一项的理论次数都等于总数/分类项数。机动目录上页下页返回结束自由度也就等于分类项数减1。例1随机地将麻将色子抛掷300次,检验该色子的六个面是否均匀。结果1-6点向上的次数依次是,43,49,56,45,66,41。解:每个类的理论次数是300/6=50,代入公式:机动目录上页下页返回结束eefff202)(50)5056(50)5049(50)5043(22250)5041(50)5066(50)5045(2221.11)5(96.8205.0因此,在0.05的显著性水平下,可以说这个色子的六面是均匀的。例2随机抽取60名高一学生,问他们文理要不要分科,回答赞成的39人,反对的21人,问对分科的意见是否有显著的差异。解:如果没有显著的差异,则赞成与反对的各占一半,因此是一个无差假设的检验,于是理论次数为60/2=30,代入公式:机动目录上页下页返回结束eefff202)(30)5021(30)3039(2284.3)1(4.5205.0所以对于文理分科,学生们的态度是有显著的差异的。例某商场统计了一周中七天的顾客平均数如下表所示,请问该商场一周各天的顾客数是否有显著性差异?机动目录上页下页返回结束星期日星期一星期二星期三星期四星期五星期六顾客数15000105001180012200132001400018500三、检验假设分布的概率这里的假设分布可以是经验性的,也可以是某理...