第二节估计量及其性质1简单随机抽样的几个重要结论2总体目标量的估计3估计量的性质(2)简单估计量(1)ˆYy设1,,nyy1N是总体{Y,,Y}的一个简单随机样本,则ˆ(2)YNyˆ(3)Pp3估计量的性质ˆ()()EYEyY性质11,,nyy1N设是总体{Y,,Y}的一个简单随机样本,则(1)均值估计量的性质221SnfSNnnNyV性质2样本均值的方差为注:影响样本均值方差的因素有三个:n,S2,f3估计量的性质性质3(1)均值估计量的性质性质4222ˆ()()ESEsS的无偏估计为:Vyvyfns12其中S2,s2分别表示总体方差与样本方差。例1:从N=200的总体中抽出一个n=10的简单随机样本(如下表),求总体均值的估计和估计量方差的估计。序号i12345678910yi34267544353估计量的性质性质51,,nyy1N设是总体{Y,,Y}的一个简单随机样本,则(2)总量估计量的性质性质6总量估计量的方差为ˆ()()EYENyY221ˆV()()fYVNyNSn性质7总量估计量方差的无偏估计为221ˆv()()fYvNyNsn3估计量的性质性质8(3)比例估计量的性质性质9ˆ()()EPEpPV(p)的无偏估计为(1)()1NnPPVpNn性质101()(1)1fvpppn样本比例p的方差为其中P,p分别表示总体比例与样本比例。例2:某公司为了了解其产品在某小区(几万人)的市场占有率,从总体中抽出一个n=400的简单随机样本,调查发现使用该产品的居民有140人,(1)估计该小区居民使用该产品的比例(2)求该估计量方差的估计。问题:(1)区间估计的概念(2)正态总体参数的区间估计(3)抽样调查中总体参数的区间估计4、区间估计设总体Χ的分布中含有未知参数θ,如果对于给定置信区间.(1)区间估计的定义的概率,存在统计量及)10(1112ˆ(,,,)nyyy212ˆ(,,,)nyyy,使得12ˆˆ()1,P则称随机区间为未知参数θ的置信度为的1)ˆ,ˆ(21分别称为置信下限及双侧置信上限.21ˆ,ˆ置信水平或置信度.1称为几点说明2.反映了估计的精确度.12ˆˆ的值0.1,0.05,0.025等,然后找最小的估计区间.1.反映了估计的可靠性.13.提高可靠性会使精度降低.为此,通常取几个固定求参数置信区间先保证可靠性再提高精度.求正态总体未知参数的置信区间的一般步骤(1)选取的一个较优的点估计ˆ(2)由ˆ寻找一个依赖于样本与的函数uu(X1Xn)u的分布为已知分布(3)对给定的置信水平1确定1与2使P{1u2}1一般可选取满足2}{}{21uPuP的1与2(4)利用不等式变形导出套住的置信区间),(3、抽样调查中总体参数的区间估计性质11:大样本(n>30)下,抽样调查估计量近似服从正态分布,即ˆ||()1ˆ()PtV由得ˆˆˆˆ[(),()tVtV]在置信度下的(近似)区间估计.1ˆˆˆ~(,()).NV为其中t为标准正态分布的双侧分位数。例2:某公司为了了解其产品在某小区(几万人)的市场占有率,从总体中抽出一个n=400的简单随机样本,调查发现使用该产品的居民有140人,(1)估计该小区居民使用该产品的比例。(3)给出该比例在95%置信度下的区间估计。(2)求该估计量方差的估计。第三节样本量的确定1费用限制2精度要求设C表示抽样调查工作的总费用,可大致分为两个构成部分:一部分为固定费用,用c0表示,不管调查单位数的多少,这部分费用都要花费,主要包括组织领导、宣传、设计等费用。一部分为可变费用,用c1表示,它是每调查一个单位平均要花的费用,则调查总费用函数为:C=c0+c1n(一)根据调查费用来确定n当某项抽样调查工作所能得到的总费用一定,且c0和c1依其他有关资料也大致可以确定时,就可推算出必要的抽样单元数目01Ccnc1、精度与样本量的关系在置信度1-α下,保证总体参数θ与其估计量ˆ的差值在误差限之内:ˆ()1Pd或ˆ()1.Pr(二)根据精度要求来确定对待估参数的精度的要求一般用绝对误差d或相对误差r来表示,即性质11:大样本(n>30)下,抽样调查估计量近似服从正态分布,即ˆ||()1ˆ()PtV...