抽样方法与总体分布的估计学习导引刘洪明本章“统计”部分是在初中“统计初步”和高中“概率”内容的基础上来学习的,所介绍的抽样方法比初中更系统和详细,而用样本频率分布去估计总体分布,更是初中相关内容的继续和深入。一、学习目标1.理解三种抽样方法:简单随机抽样,系统抽样,分层抽样的概念、各自的特点、相互联系、适用范围、操作方法,会根据具体问题中的条件、要求,选用恰当的抽样方法从总体中抽取样本。2.会编制样本频率分布表,画出频率分布条形图或直方图,用样本频率分布去估计总体分布。二、内容解析1.抽样方法(1)简单随机抽样:当总体中的个体较少时,可采用逐个地、不放回且等概率地抽取样本。具体操作时可用抽签法或随机数表法。(2)系统抽样:当总体中的个体较多时,可将总体编号,按需要抽取的样本数均分成若干段,再按照一定的规则在每一段中抽取一个个体。(3)分层抽样:当总体是由差异明显的几个部分组成的,可将总体按差异分成几个部分(层),再按各部分在总体中所占比例进行抽样。应该注意到,在系统抽样和分层抽样中,最后仍需用简单随机抽样来完成。因此,简单随机抽样是其它各种抽样的基础。另外,不论用哪种抽样方法,不论是“逐个地抽取”,还是“一次性地抽取”,总体中的每个个体被抽到的概率都是一样的。2.总体分布的估计在通常情况下,一个总体中的个体是相当多的,甚至是无穷多的。如果逐个考查每个个体,往往是困难的,甚至是办不到的。这就要求我们运用上述的抽样方法,抽取一个样本,用样本的频率分布来对总体进行估计。样本的容量越大,这种估计越精确。当总体中的个体取不同值很少时,可由不同取值及相应的频率列出分布表,并用相应的条形图来表示。当总体中的个体取值较多时,可将不同取值分别放入相应的区间内,列出不同区间内取值的频率分布表,并依此画出相应的直方图。有了样本频率分布表或直方图,就容易估计出总体的各种属性,对总体作出推断。三、典型例题例1.(见教科书P22第4行)现要用系统抽样的方法,从一个个体数为1003的总体中,抽取一个容量为50的样本,那么总体中的每个个体被抽到的概率是()A.B.C.D.解:由于1003除以50,得余数为3,因此,在用系统抽样时,首先应从总体中剔除3个个体,可用简单随机抽样的方法(可利用随机数表)。那么对于总体中某个个体a而言,未被剔除而被留在剩余总体内的概率为。接着进行系统抽样,从1000个个体中抽取50个,则个体a被抽到的概率为。综上,个体a被抽到的概率为故应选D。说明:本题容易错误认为:删除了3个个体后,从1000个个体中用系统抽样的方法抽取50个,每个个体被抽到的概率为。实际上,后面的系统抽样,是在删除3个个体的前提下来进行的(即条件概率)。例2.(见教科书P1913页)从个体数为N的总体中,抽取一个容量为n的样本,求总体中任一指定个体a被抽到的概率。如果(1)采用逐个抽取的方法;(2)采用一次性抽取的方法。解:我们知道,从个体数为N的总体中,抽取一个个体,那么第N个个体被抽到的概率为,未被抽到的概率为。(1)在逐个抽取n个个体时,a被抽到的情况及其概率情况如下:第1次被抽到,;第2次被抽到,;第3次被抽到,;……第n次被抽到由于以上几个事件彼此互斥,根据互斥事件的概率加法公式,个体a被抽到的概率为(2)在一次性抽取n个个体时,个体a被抽到时,只要再从剩余的(N-1)个个体中,抽取个个体即可。因此,这时的概率为以上结果说明,“逐个抽取”与“一次性抽取”,对于总体中的每个个体而言,被抽到的概率是相同的。因此,简单随机抽样确实体现了抽样的客观公平性。而其它更复杂的抽样,又以简单随机抽样为基础,就使得这些抽样方法也具有客观公平性。例3.某生产企业共有800人,其中管理人员40人,技术人员120人,一线工人640人。现要调查了解全厂人员的(1)身高与血型情况;(2)家庭人均生活费用情况。试用恰当的抽样方法抽取一个容量为40的样本,并说明操作过程。解:(1)身高和血型,与其职务无关,全厂人员又很多,故应采用系统抽样法。将全厂人员按1至800编号,再按编号顺序分成40组,每组20人。先在第1组中用抽签法抽出k号(1...