5.1统计5.1.4用样本估计总体第五章统计与概率学习目标1.了解分层抽样中的均值与方差,会用样本的数字特征估计总体的数字特征.2.理解频率分布直方图中有关数字特征的含义,会用样本的分布估计总体的分布.3.在解决问题过程中,进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程.重点:总体数字特征的计算和总体分布的估计.难点:频率分布直方图中有关数字特征的计算.知识梳理1.用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.所以,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.2.分层抽样的均值与方差以分两层抽样的情况为例.假设第一层有m个数,分别为x1,x2,…,xm,平均数为x,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为y,方差为t2.则x=m11imxi,s2=11mim(xi-x)2,y=11niiyn,t2=211()niiyyn.如果记样本均值为a,样本方差为b2,则可以算出a=1mn(1mixi+1niyi)=mxnymn,b2=2222[()][()]msxantyamn=1mn222()()mnmsntxymn.这个公式推导如下: s2=11mim(xi-x)2=11mim(xi-a+a-x)2=11mim[(xi-a)2+2(a-x)(xi-a)+(a-x)2]=1m1mi(xi-a)2+2(a-x)1mi(xi-a)+1mi(a-x)2=1m1mi(xi-a)2-2m(x-a)2+m(x-a)2=1m1mi(xi-a)2-m(x-a)2,∴1mi(xi-a)2=m[s2+(x-a)2].同理1ni(yi-a)2=n[t2+(y-a)2].(x-a)2=(x-mxnymn)2=22()()nxymn,同理(y-a)2=22()()mxymnb2=2211()]()mniixayamn=2222[()][()]msxantyamn=222221()()()mnxymsntmnmn222()()mnxymn=1mn222()()mnmsntxymn.3.用样本的分布来估计总体的分布如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多.特别地,每一组的频率与总体对应的频率相差不会太大.如果容许有一定误差,则可以用样本的分布去估计总体的分布.而且,在总体的分布不可能获得时,只能用样本的分布去估计总体的分布.同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,(πi-pi)2=[(π1-p1)2+(π2-p2)2+…+(πn-pn)2]不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.题型一用样本估计总体常考题型例1[2019·甘肃庆阳第一中学高一月考]为了调查某校高三学生的身高,随机抽取了50名学生实测身高的数据(单位:cm)如下:175168170176167181162173171177179172165157172173166177169181160163166177175174173174171171158170165175165174169163166166174172166172167172175161173167(1)求这50名学生的身高的平均数、标准差.(2)如果用简单随机抽样的方法从这50名学生中再抽取一个样本容量为10的样本,试设计抽取方案并求出抽取的10名学生身高的平均数及方差.【解】(1)x=150(175+168+…+167)=170.1,s=2221[(175170.1)(168170.1)(167170.1)]50≈5.6.(2)将50名学生编号,分别为00,01,…,49,做成便签,摇匀后从其中随机抽一编号,得其对应学生身高为176,摇匀后再抽一编号,得其对应学生身高为173……依次类推得到10名学生的身高如下:176,173,167,169,174,181,158,166,165,171.故平均数为110(176+173+…+171)=170.方差为110[(176-170)2+(173-170)2+…+(171-170)2]=37.8.【归纳总结】平均数的计算方法(1)定义法:当所给数据x1,x2,…,xn比较小,又比较分散时,一般选用公式x=12...