4用样本估计总体第五章统计与概率学习目标1
了解分层抽样中的均值与方差,会用样本的数字特征估计总体的数字特征
理解频率分布直方图中有关数字特征的含义,会用样本的分布估计总体的分布
在解决问题过程中,进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程
重点:总体数字特征的计算和总体分布的估计
难点:频率分布直方图中有关数字特征的计算
用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征
特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大
在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等
所以,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可
分层抽样的均值与方差以分两层抽样的情况为例
假设第一层有m个数,分别为x1,x2,…,xm,平均数为x,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为y,方差为t2
则x=m11imxi,s2=11mim(xi-x)2,y=11niiyn,t2=211()niiyyn
如果记样本均值为a,样本方差为b2,则可以算出a=1mn(1mixi+1niyi)=mxnymn,b2=2222[()][()]msxantyamn=1mn222()()mnmsntxymn
这个公式推导如下: s2=11mim(xi-x)2=11mim(xi-a+a-x)2=11mim[(xi-a)2+2(a-x)(xi-a)+(a-x)2]=1m1mi(xi-a)2+2(a-x)1mi(xi-a)+1mi(a-x)2=1m1