第十一章区间估计置信区间正态总体下的置信区间第一节置信区间ˆˆ对应总体的某一个样本观测值,我们可以得到点估计量的一个观测值,但是它仅仅是参数θ的一个近似值.由于是一个随机变量,它会随着样本的抽取而随机变化,不会总是和θ相等,而存在着或大、或小,或正、或负的误差.即便点估计量具备了很好的性质,但是它本身无法反映这种近似的精确度,且无法给出误差的范围.为了弥补这些不足,我们希望估计出一个范围,并知道该范围包含真实值的可靠程度.这样的范围通常以区间的形式给出,同时还要给出该区间包含参数θ真实值的可靠程度.这种形式的估计称之为区间估计.第一节置信区间例对明年小麦的亩产量作出估计为:若设X表示明年小麦亩产量,则估计结果为P(800≤X≤1000)=80%明年小麦亩产量八成为800-1000斤.区间估计第一节置信区间例1某农作物的平均亩产量X(单位)服从正态分布N(μ,σ2),今随机抽取100亩进行试验,观察其亩产量值x1,x2,…,x100,基此算出,因此μ的点估计值为500.由于抽)(500kgx样的随机性,μ的真值与的值总有误差,我们希望以x95%的可靠度估计与μ的最大误差是多少?x因为,),(~2nNx从而存在c>0,使得,95.0)|(|cXP因此,这个c就是可允许的最大误差第一节置信区间定义设X1,X2,…,Xn是来自总体f(x,)的样本,未知,对于任给(0<<1),若有统计量则称随机区间为的双侧1的置信区间,1为置信水平,),,...,,(21nXXX1}{P],[限。α的置信上限和置信下分别称为置信度为1θ和,θ),,...,,(21nXXX使得第一节置信区间.,"],[",1)],...,,(),,...,,([:2121则犯错误的概率为的真值含着参数包区间因此若认为的真值的概率为包含参数区间随机解释为的区间估计的意义可以参数nnXXXXXX.1],[],,[1,的概率包含以而只能说区间的概率落入随机区间以所以不能说参数不是随机变量由于第一节置信区间α包含参数θ.))以概率1x,...,x,(xθ,)x,...,x,(xθ不能说区间(要么没有包含参数θ,θ,要么包含了参数)),x,...,x,(xθ),x,...,x,(xθ(得到的一个确定的区间对于一次具体的抽样所n21n21n21n21参数θ.α)%的区间包含未知大约有100(1这些区间中)),x,...,x,(xθ),x,...,x,(xθ(将得到许多不同的区间在重复取样下,n21n21第一节置信区间在上述讨论中,对于未知参数,我们给出两个统计量,,得到的双侧置信区间(,).但在一些实际问题中,例如,对于设备,元件的寿命来说,平均寿命长是我们所希望的,我们关心的是平均寿命的"下限",与此相反,在考虑化学药品中杂质含量的均值EX时,我们常关心参数EX的"上限".这就引出了单侧置信区间的概念.第一节置信区间对于给定值(0<<1),若由样本),,,(21nXXX确定的统计量),,,(21nXXX,对于任意满足P{}1-,称随机区间(-,)是的置信水平为1-的单侧置信区间,称为的置信水平为1-的单侧置信上限.对于给定值(0<<1),若由样本),,,(21nXXX确定的统计量),,,(21nXXX,对于任意满足P{>}1-,称随机区间(,)是的置信水平为1-的单侧置信区间,称为的置信水平为1-的单侧置信下限.第一节置信区间对于给定的置信度1,怎样根据样本来确定未知参数θ的置信区间)ˆ,ˆ(21,就是参数θ的区间估计问题.求未知参数θ的置信区间的步骤如下:(2)构造一个含有未知参数θ而不含有其他未知参数的枢轴函数),,,,(21nXXXGG,且已知其分布.(3)对给定的置信度1,根据);,,,(21nXXXG的分布定出分位点a和b,使得1),,,(21bXXXGaPn(1)先求出未知参数θ的一个点估计),...,,(21nXXX.第一节置信区间(4)将不等式bXXXGan);,,(,21中解出θ,得出其等价形式nnXXXXXX,,,,,,2121这时必有1),,,(),,,(2121nnXXXXXXP于是),(即为θ的置信度为1的置信区间.例1某农作物的平均亩产量X(单位)服从正态分布N(μ,σ2),今随机抽取100亩进行试验,观察其亩产量值x1,x2,…,x100,基此算出,因...