数据的描述性分析本章内容第一节集中趋势的描述第二节离散程度的描述第三节分布的偏态与峰度集中趋势集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少
对集中趋势进行描述就是寻找数据一般水平的中心值或代表值
众数位置平均数中位数平均数算术平均数数值平均数调和平均数几何平均数1
数值平均数:是以统计数列的所有数据来计算的平均数
其特点是统计数列中任何一项数据的变动,都会在一定程度上影响数值平均数的计算结果
位置平均数:它不是对统计数列中所有数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的
数值平均数包括算术平均数、调和平均数和几何平均数
算术平均数(均值,ArithmeticMean)总体均值常用或表示,样本均值常用表示,样本均值的计算公式:Xx简单算术平均数:nxnxxxxniin121加权算术平均数:11niiiniixfxf3
1数值平均数权数的意义和作用•权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用
•当各组的次数都相同时,即当时:加权算术平均数就等于简单算术平均数
123====nffff1111nnniiiiiiiniixffxxxnfnf例:计算某车间工人加工零件平均数(组距式数列)解:26406640iiiiixfXf个关于计算结果的说明●根据原始数据和分组资料计算的结果一般不会完全相等,根据分组数据只能得到近似结果
●只有各组数据在组内呈对称或均匀分布时,根据分组资料的计算结果才会与原始数据的计算结果一致
各变量值与均值的离差之和等于零
=1=0niixx(2)
各变量值与均值的离差平方和最小
2=1=minniixx