第四章总体均数的估计和假设检验一、教学大纲要求(一)掌握内容1.抽样误差、可信区间的概念及计算;2.总体均数估计的方法;3.两组资料均数比较的方法,理解并记忆应用这些方法的前提条件;4.假设检验的基本原理、有关概念(如I、II类错误)及注意事项。(二)熟悉内容两样本方差齐性检验。(三)了解内容1.t分布的图形与特征;2.总体方差不等时的两样本均数的比较;3.等效检验。二、教学内容精要(一)基本概念1.抽样误差抽样研究中,样本统计量与总体参数间的差别称为抽样误差(samplingerror)。统计上用标准误(standarderror,SE)来衡量抽样误差的大小。不同的统计量,标准误的表示方法不同,如均数的标准误用表示,率的标准误用SP表示,回归系数的标准误用Sb表示等等。均数的标准误与标准差的区别见表4-1。表4-1均数的标准误与标准差的区别均数的标准误标准差意义反映的抽样误差大小反映一组数据的离散情况记法(样本估计值)(样本估计值S)计算===S=控制方法增大样本含量可减小标准误。个体差异或自然变异,不能通过统计方法来控制。2.可信区间(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidenceinterval,CI)。它的确切含义是:CI是随机的,总体参数是固定的,所以,CI包含总体参数的可能性是1-。不能理解为CI是固定随机的,总体参数是随机固定的,总体参数落在CI范围内可能性为1-。当时,称为95%可信区间,记作95%CI。当时,称为99%可信区间,记作99%CI。(2)可信区间估计的优劣:一定要同时从可信度(即1-的大小)与区间的宽度两方面来衡量。(二)t分布与正态分布t分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t分布峰值较低,而尾部较高;③随自由度增大,t分布趋近与标准正态分布;当时,t分布的极限分布是标准正态分布。(三)总体均数的估计参数估计有点估计和区间估计两种方式。总体均数的估计,见表4-2。表4-2总体均数的估计点估计区间估计意义直接用样本统计量代替总体参数。用统计量和确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。估计方法以作为估计值①小样本(,)②大样本(,)③两总体均数差值的可信区间(,)(四)两均数差别的比较1.样本均数和总体均数比较的t检验前提:服从正态分布:;:,(4-1)2.配对设计的t检验前提:差值服从正态分布:;:,(4-2)3.成组设计的两样本均数比较的t检验前提:两组数据均服从正态分布;两组总体方差相等:;:,(4-3)其中,=,(4-4)表示两样本均数差值的标准误。4.单样本u检验前提:当样本较大(如n>50)或总体已知时(n较大时)(4-5)(已知时)(4-6)5.大样本均数比较的u检验前提:样本足够大成组设计的两样本均数比较可用:(4-7)6.要推断组间没有差别或差别很小,应采用等效检验(squivalencetest)。(五)假设检验的步骤及有关概念1.基本思想:把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。2.步骤:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P值并作出推断结论。3.I类错误:为真(实际无差别),假设检验结果拒绝,接受(推论有差别)所犯的错误称为I类错误(typeIerror),I类错误的概率记作。II类错误:为真(实际有差别),假设检验结果拒绝,接受(推论无差别)所犯的错误称为II类错误(typeIIerror),II类错误的概率记作。4.1-称为检验效能,过去称把握度(poweroftest),即两总体确有差别,按水准能发现该差别的能力。三、典型试题分析(一)单项选择题1.当样本含量增大时,以下说法正确的是()A.标准差会变小B.样均数标准误会变小C.均数标准误会变大D.标准差会变大答案:B[评析]本题考点:这道题是考察均数标准误的概念。从均数标准误的定义讲,它反映的是均数抽样误差的大小,那么样本含量越大,抽样误差应该越小。从均数标准误的计算公式来看,也应是n越大,越小。2.区间2.58的含义是()A.99%的总体均数在此范围内B.样本均数的99%可信区间C.99%的样本均数在此范围内D.总体均数的99%可信区间...