2.2.2用样本的数字特征估计总体的数字特征一、众数、中位数、平均数(1)众数:在样本数据中,频率分布最大值所对应的样本数据或出现次数最多的那个数据。(2)中位数:样本数据中,累计频率为0.5时所对应的样本数据或将数据按大小排列,位于最中间的数据(如果数据的个数为偶数,就取当中两个数据的平均数作为中位数)。(3)平均数:样本数据的算术平均数,即123nxxxxxn例1.从某大型企业全体员工某月的月工资表中随机抽取50名员工工资资料如下:800800800800800100010001000100010001000100010001000100012001200120012001200120012001200120012001200120012001200120012001200120012001200150015001500150015001500150020002000200020002000250025002500平均数是这50个数值的和除以50得1320.估计这个企业员工的平均工资是1320元.同样,再随机抽取50名员工的工资,计算所得的样本平均数一般会与例1中的样本平均数不同。所以用样本的平均数估计总体的平均数时,样本的平均数只是总体的平均数的近似值。ƽ¾ùÊý13200.060.100.140.400.30123nxxxxxn在频率分布直方图中,平均数是直方图的平衡点,假设横轴是一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡。三种数字特征的比较:(1)样本众数通常用来表示分离变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分离变量的中心位置;(2)中位数不受少数几个极端数据的影响,容易计算,它仅利用了数据中排在中间的数据的信息。当样本数据质量比较差,即存在一些错误数据时,应该用抗极端数据强的中位数表示数据的中心值。(3)平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大,与众数和中位数相比,平均数代表了数据更多的信息,当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差。(4)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值。在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策。练习题:1.若M个数的平均数是x,N个数的平均数是y,则这M+N个数的平均数是.MxNyMN,12,,,nyyy12,,,nxxx1122,,,nnxyxxy和的样本平均数分别是x和y,那么一组数的平均数是2.如果两组数.二、用样本的标准差估计总体的标准差数据的离散程度可以用极差、方差或标准差来描述。为了表示样本数据的单位表示的波动幅度,通常要求出样本方差或者它的算术平方根.(1)方差:设在一组数据,x1,x2,…,xn中,各数据与它们的平均数x的差的平方分别是22212(),(),,()nxxxxxx2222121[()()()]nsxxxxxxn来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大。那么我们用它们的平均数,即(2)标准差:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的量。222121[()()()]nsxxxxxxn例1.计算数据5,7,7,8,10,11的标准差.解:x=———————=85+7+7+8+10+116数据xixxi-x(xi-x)258-3978-1178-1188001082411839方差s2=———————=4;9+1+1+0+4+96标准差.24s所以这组数据的标准差是2.练.计算数据89,93,88,91,94,90,88,87的方差和标准差。(标准差结果精确到0.1)解:190(13214023)908x.所以这组数据的方差为5.5,标准差为2.3.例4.从甲、乙两名学生中选拔一人乘积射击比赛,对他们的射击水平进行测试,两人在相同的条件下各射击10次,命中环数如下﹕甲﹕7,8,6,8,6,5,8,10,7,4;乙﹕9,5,7,8,7,6,8,6,7,7.(1)计算甲、乙两人射击命中环数的平均数和标准差;(2)比较两人的成绩,然后决定选择哪一人参赛.解:(1)计算得x甲=7,x乙=7;s甲=1.73,s乙=1.10.(2)由(1)知,甲、乙两人平均成绩相等,但s乙