2用样本的数字特征估计总体的数字特征一、众数、中位数、平均数(1)众数:在样本数据中,频率分布最大值所对应的样本数据或出现次数最多的那个数据
(2)中位数:样本数据中,累计频率为0
5时所对应的样本数据或将数据按大小排列,位于最中间的数据(如果数据的个数为偶数,就取当中两个数据的平均数作为中位数)
(3)平均数:样本数据的算术平均数,即123nxxxxxn例1
从某大型企业全体员工某月的月工资表中随机抽取50名员工工资资料如下:800800800800800100010001000100010001000100010001000100012001200120012001200120012001200120012001200120012001200120012001200120012001200150015001500150015001500150020002000200020002000250025002500平均数是这50个数值的和除以50得1320
估计这个企业员工的平均工资是1320元
同样,再随机抽取50名员工的工资,计算所得的样本平均数一般会与例1中的样本平均数不同
所以用样本的平均数估计总体的平均数时,样本的平均数只是总体的平均数的近似值
ƽ¾ùÊý13200
30123nxxxxxn在频率分布直方图中,平均数是直方图的平衡点,假设横轴是一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡
三种数字特征的比较:(1)样本众数通常用来表示分离变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分离变量的中心位置;(2)中位数不受少数几个极端数据的影响,容易计算,它仅利用了数据中排在中间的数据的信息
当样本数据质量比较差,即存在一些错误数据时,应该用抗极端数据强的中位数表示