1第一节有关基本概念一、总体总体也叫母体,它是所要认识对象的全体,是具有同一性质的许多单位的集合。组成总体的每个个体叫做单位。在抽样以前,把总体划分成若干个互不重叠并且能组合成总体的部分,每个部分称为一个抽样单元,不论总体是否有限,总体中的抽样单元数一定是有限的。抽样单元又有大小之分,一个大的抽样单元可以分成若干个小的抽样单元,最小的抽样单元就是每一个个体。第一页,共二十一页。2总体应具备同质性、大量性和差异性的特征。在抽样调查中,通常将反映总体数量特征的综合指标称为总体参数。常见的总体参数主要有:总体总和、总体均值、总体比率、总体比例。第二页,共二十一页。3二、样本样本是由从总体中所抽选出来的若干个抽样单元组成的集合体。抽样前,样本是一个n维随机变量,属样本空间;抽样后,样本是一个n元数组,是样本空间的一个点。抽样的效果好不好,依赖于样本对总体是否有充分的代表性。影响样本代表性的因素有以下几个方面:(1)总体标志值分布的离散程度。(2)抽样单元数的多少(或称样本容量的大小)。(3)抽样方法。第三页,共二十一页。4一般将反映样本数量特征的综合指标称之为统计量。统计量是n元样本的一个实值函数,是一个随机变量,统计量的一个具体取值即为统计值。主要的样本统计量有:样本总和、样本均值、样本比率、样本比例。第四页,共二十一页。5三、必要样本容量和样本可能数目样本中包含的抽样单元个数称为样本容量。样本容量与总体容量之比为抽样比,用f表示,即f=n/N。样本可能数目则是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数。正确理解样本可能数目的概念,对于准确理解和把握抽样误差的计算、样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。第五页,共二十一页。6四、抽样框抽样框是在抽样前,为便于抽样工作的组织,在可能条件下编制的用来进行抽样的、记录或表明总体所有抽样单元的框架,在抽样框中,每个抽样单元都被编上号码。抽样框可以是一份清单(名单抽样框)、一张地图(区域抽样框),也可以是一段时序。第六页,共二十一页。7第二节样本统计量的抽样分布标准的统计问题为:总体未知,故需从总体中抽取一个较小的、花费不多的随机样本,然后构造样本统计量,并以其估计总体。问题是用样本指标估计总体指标的可靠程度如何?为此要研究样本统计量的抽样分布。在此之前,有必要先回顾一下有关正态分布的知识。第七页,共二十一页。8一、正态分布一个正态分布完全由总体的理论平均数和理论方差这两个参数所决定。如果一个随机变量X服从正态分布,则其分布的密度函数(分布曲线方程)为:2)(2121)(xexf第八页,共二十一页。任何正态分布,它的样本落在任意区间(a,b)内的概率等于直线x=a,x=b,横坐标和曲线f(x)所夹的面积(可由正态分布概率积分表查得)。经计算,正态总体的样本落在:9(X-σ,X+σ)概率是68.27%;(X-2σ,X+2σ)概率是95.45%;(X-3σ,X+3σ)概率是99.73%;(X-1.96σ,X+1.96σ)概率是95%。第九页,共二十一页。二、抽样分布样本统计量是个随机变量。把根据所有可能样本计算出来的某一统计量的数值分布,称为抽样分布。抽样分布理论是理解抽样调查基本原理的基础。常见的抽样分布有极限分布和精确分布两类。极限分布也叫做大样本分布,它只有正态分布一种形式。精确分布又叫做小样本分布,其前提是总体服从正态分布,它是正态分布的导出分布,包括有t分布、F分布和χ2分布等形式。10第十页,共二十一页。第三节抽样误差一、抽样调查中的误差来源误差就是调查结果与现象的实际结果之间的偏差。在抽样调查中,按照形成原因的不同,一般可将误差分成抽样误差和非抽样误差两大类。抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差。抽样误差通常会随样本量的大小而增减;影响抽样误差的因素还有:所研究现象总体变异程度的大小;抽样的方式方法。11第十一页,共二十一页。非抽样误差不是由于抽样引起的。它又包括调查误差、无回答误差、抽样框误差以及登记性误差。同抽样误差相反,非抽样误差是随着样本...