11概率论与数理统计第21讲本讲义可在网址http://math.shekou.com下载22§6.3置信区间33点估计仅仅是未知参数的一个近似值,它没有给出这个近似值的误差范围.若能给出一个估计区间,让我们能较大把握地(其程度可用概率来度量之)相信未知参数的真值被含在这个区间内,这样的估计显然更有实用价值.本节将引入的另一类估计即为区间估计,在区间估计理论中,被广泛接受的一种观点是置信区间,它是奈曼(Neymann)于1934年提出的.44一,置信区间的概念定义1设为总体分布的未知参数,X1,X2,…,Xn是取知总体X的一个样本,对给定的数1(0<<1),若存在统计量=(X1,X2,…,Xn),=(X1,X2,…,Xn).使得P{<<}=1.(3.1)则称随机区间(,)为的1双侧置信区间,称1为置信度,又分别称与为的双侧置信下限与双侧置信上限.55注:①置信度1的含义:在随机抽样中,若重复抽样多次,得到样本X1,X2,…,Xn的多个样本值x1,x2,…,xn,对应每个样本值都确定了一个置信区间(,),每个这样的区间要么包含了的真值,要么不包含的真值.根据大数定理,这些区间中包含真值的频率接近置信度1.②置信区间(,)也是对未知参数的一种估计,区间的长度意味着误差,故区间估计与点估计是互补的两种参数估计66③置信度与估计精度是一对矛盾.置信度1越大,置信区间(,)包含的概率就越大,但区间(,)的长度就越大,对未知参数的估计精度就越差.反之,对参数的估计精度越高,置信区间(,)长度就越小,(,)包含的真值的概率就越低,置信度1越小.一般准则是:在保证置信度的条件下尽可能提高估计精度.77例1设总体X~N(,2),2为已知,为未知,设X1,X2,…,Xn是来自X的样本,求的置信水平为1的置信区间.解我们知道X是的无偏估计.且有~(0,1)./XNn按标准正态分布的双侧分位数的定义,有/21./XPun88式子/2/2/2/2/2/2||/XuXunnuXunnXuXunn/21./XPun中的事件99由/21./XPun得/2/21XuXuPnn我们得到了的一个置信水平为1的置信区间/2/2,(3.2)XuXunn1010这样的置信区间常写成/2/2,(3.2)XuXunn/2Xun如果取=0.05,即1=0.95,又若=1,n=16,查表得u/2=u0.025=1.96.于是我们得到一个置信水平为0.95的置信区间11.96,(0.49).(3.3)16XX即1111再者,若由一个样本值算得样本均值的观察值x=5.20,则我们得到一个置信水平为0.95的置信区间(5.200.49),即(4.71,5.69)注意,这已经不是随机区间了.但我们仍称它为置信水平为0.95的置信区间,是指的这个区间包含的可信程度为95%.11.96,(0.49).(3.3)16XX即1212例2设总体X~N(,8),为未知参数,X1,…,X36是取自总体X的简单随机样本,如果以区间(X1,X+1)作为的置信区间,那么置信度是多少?解2~(,/)(,8/36)(,2/9).XNnNN{11}{||1}3321222/30.9661PXXPXXP1313二,寻求置信区间的方法寻求置信区间的基本思想:在点估计的基础上,构造合适的含样本及待估参数的函数U,且已知U的分布.再针对给定的置信度导出置信区间.1414一般步骤:(1)选取未知参数的某个较优估计量ˆ;(2)围绕ˆ构造一个依赖于样本与参数的函数U=U(X1,X2,…,Xn,);(3)对给定的置信水平1,确定1和2,使P{1U2}=1(3.4)通常可选取满足P{U1}=P{U2}=2的1和2,在常用分布下,这可由查表得到.1515(4)对不等式1U2作恒等变形后化为P{}=1,(3.5)则(,)就是的置信度为1的双侧置信区间.1616三,(0-1)分布参数的置信区间考虑(0-1)分布情形,设其总体X的分布率为P{X=1}=p,P{X=0}=1p,(0