1 样本量确定公式的推导(教材 123~124 页)教材 123 页中间的“ 3、调查的可靠程度”中的P 为统计学中的置信度或置信水平,如常用的0.95、0.99,也就是 1;这一段中的t 就是 t 分布中的t 值,类似于正态分布中的Z值。一、平均数的样本量公式(一)重复抽样:222Xtn(6.2)推导过程:对于正态分布,当显著性为α 时,置信区间可以写为:SEZXX2(1)式中: μ 为总体平均数,X 为样本平均数, Z 2 为标准正态分布的统计量,下面简写为Z, SEX 为样本平均数的抽样标准差,即标准误,下面简写为SE,于是上式简写为:SEZX*(2)nZX*(3)式中,σ 为总体标准差,n 为样本大小。因为总体标准差σ 通常是未知的,因此就用t 分布代替标准正态分布,(3)式就为:2 ntX*(4)移项,得到:ntX*(5)令:XX,称为平均数的抽样极限误差(或抽样最大允许误差),于是( 5)式为:ntX*(6)或者,SEtX*(7)将( 6)式两边平方,得到:ntX222(8)于是得到上述公式(6.2)(二)不重复抽样22222ttXNNn(6.3)推导过程:NnnSE1(9)式中, N 为总体大小将( 9)式代入( 7)式,得到:NnntX1*NnNnt *(10)将( 10)两边平方,得到3 nNnNNnNntttX2222222(11)去分母,得到:nNnNttX22222移项,得到:NnNttX22222于是,得到上述(6.3)式。124 页的例题 :其中有些印刷错误,下面的是改正后的例题,其中涂黄色的为原来是印刷错误的。例如,某市进行居民家计调查,按照简单随机不重复抽样方式。已知 N=100 000,2=10 000,SE=5元, SE为抽样标准误,求 t=2 时所需的样本量。解:根据上述公式(7),元105*2* SEtX将有关已知条件代入(6.3)式,就得到书上结果,需要抽398 户。当 t=3 时,若极限抽样误差X 不变, 仍为 10,这就意味着抽样标准误 SE缩小为 3.3 元,(以下和书上一致了) ,即需要抽892 户。4 可见,在允许误差和其他条件不变的情况下,置信度由95.45%(t=2)提高到99.73%(t=3),需要增加的样本量为1.24 倍。书上的 95.45%和 t=2,以及 99.73%和 t=3 的对应关系是怎么得到的呢?根据该书后面的第454 页的表 3,t 分布的临界值点,是无法得到该对应关系的,因为这是一个单侧检验表;根据453 页的表 2,正态分布表,也是无法得到的,因为它也是单侧检验表。这需要从双侧检验表才能够得到,因为这个例题中n 很大,此时t 分布接近正态分布,就可以查双侧检验的正态分布表,例如...