第二节用样本估计总体重点难点重点:用样本的频率分布估计总体分布;用样本的数字特征估计总体的数字特征.难点:频率分布直方图的理解和应用.知识归纳1.编制频率分布直方图的步骤如下:①求极差:极差是一组数据的最大值与最小值的差.②决定组距和组数:当样本容量不超过100时,常分成5~12组.组距=极差组数.③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组;④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映数据在每组的大小.所占比例⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1.2.频率分布折线图(1)把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图.(2)总体密度曲线如果样本容量不断增大,分组的组距不断缩小,则频率分布折线图实际上越来越接近于一条光滑曲线,这条光滑的曲线就叫总体密度曲线.3.茎叶图统计中还有一种用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.4.平均数、中位数和众数(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数.•(3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数).5.方差、标准差设样本数据为x1,x2,…,xn样本平均数为x-,则s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2]=1n[(x21+x22+…+x2n)-nx2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.误区警示1.对频率分布直方图和茎叶图识图不准是常见的错误.在频率分布直方图中,小矩形的高=频率组距=频数组距×样本容量.频率=频率组距×组距=小矩形的面积.•2.中位数可能不在样本数据中.•3.计算公式用错或计算错误.计算平均数、方差、标准差等时计算量大,要注意计算结果的准确性.•4.直方图与条形图不要混淆.解题技巧1.在频率分布直方图中,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;中位数的估计值,应使中位数左右两边的直方图面积相等;最高小长方形的中点所对应的数据值即为这组数据的众数.•2.方差是刻画一组数据离散程度的量,它反映一组数据围绕平均数波动的大小.方差越大,这组数据波动越大,越分散.讨论产品质量、售价高低、技术高低、产量高低、成绩高低、寿命长短等等问题,一般都是通过方差来体现.注意以下结论:(1)如果x1、x2、…、xn的平均数为x-,则ax1+b,ax2+b,…,axn+b的平均数为ax-+b.(2)数据x1、x2、…、xn与数据x1+m、x2+m、…、xn+m的方差相等.(3)若x1、x2、…、xn的方差为s2,则kx1,kx2,…,kxn的方差为k2s2.计算方差时,要依据所给数据的特点恰当选取公式以简化计算.[例1]如图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为________,数据落在[2,10)内的概率约为________.频率分布直方图•解析:200×(0.08×4)=64;•(0.02+0.08)×4=0.4.•答案:64;0.4•点评:1.依据频率分布直方图计算时要牢记,...