第二章统计2.2.2用样本的数字特征估计总体的数字特征一、众数、中位数、平均数1、众数在一组数据中,出现次数最多的数据叫做这一组数据的众数。2、中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。3、平均数(1)x=1/n(x1+x2+……+xn)练习:在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:成绩(单位:米)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数,中位数与平均数解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米).二、众数、中位数、平均数与频率分布直方图的关系1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示:频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5点)众数(最高的矩形的中2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02t.频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5中位数说明:2.03这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.3.可以从频率分布直方图中估计平均数平均数的估计值=频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和三、众数、中位数、平均数的简单应用例1.某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?分析:(1)众数为200,中位数为220,平均数为300。(2)因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。四、标准差平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断,难以概括样本数据的实际状态,而数据的离散程度可以用极差、方差或标准差来描述。为了表示样本数据的单位表示的波动幅度,通常要求出样本方差或者它的算术平方根.四、标准差(1)方差:设在一组数据,x1,x2,…,xn中,各数据与它们的平均数x的差的平方分别是22212(),(),,()nxxxxxx那么我们用它们的平均数,即2222121[()()()]nsxxxxxxn来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大。(2)标准差:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的量。222121[()()()]nsxxxxxxn计算标准差的算法:S1算出样本数据的平均数x;S2算出每个样本数据与样本平均数的差(i=1,2,……,n);ixx四、标准差S3算出(i=1,2,…,n);2()ixxS4算出(i=1,2,…,n)这n个数的平均数,即为样本方差s2;2()ixxS5算出方差的算术平方根,即为样本标准差s。例2.计算数据5,7,7,8,10,11的标准差.解:S1x=———————=85+7+7+8+10+116数据xiS1xS2xi-xS3(xi-x)258-3978-1178-1188001082411839S4s2=———————=4;9+1+1+0+4+96S5.24s所以这组数据的标准差是2.例3.从某灯泡厂生产的一批灯泡中随...