第三章数据的特征量与统计分析第一节 集中量集中量是代表一组数据典型水平或集中趋势(central tendency)的量。它能反映频数分布量数据向某一点集中的情况。常用的集中量有算术平均数、中位数 Md 、众数 M0 等。一、平均数或算术平均数( mean or arithmetic average )的概念算术平均数是所有观察值的总和除以总频数之商,简称平均数或均数、均值。若以X1,X2,…,XN 表示 X 变量各个观察值,N 表示观察值的个数,则算术平均数可表示为:二、算术平均数的性质1.观察值总和等于算术平均数的 N 倍。2.在一组观察值中,每个观察值与该组均值之差(离均差)之和等于零。3.在一组数据中,每个数都加上或减去一个常数,所得的平均数为原来的平均数加上或减去此常数。4.在一组数据中,每个数都乘以或除以一个常数,所得的平均数为原来的平均数乘以或除以这个常数。5.假如某一组观察值是由多个部分组成,这组观察值的平均数可由组成部分的平均数求得三、算术平均数的计算方法1.原始数据计算法2.频数分布表计算法可以用频数分布表计算一组数据算术平均数的近似值。公式为:频数分布表计算法3.用假定平均数计算平均数的方法设假定平均数为 A,则,用假定平均数计算算术平均数的公式为:四、加权平均数、几何平均数、调和平均数六、算术平均数的优缺点算术平均数具备一个良好的集中量所应具备的一些特点:反应灵敏、有公式严密确定、简明易懂、适合代数运算等等,因此是一个最常用的集中量。主要不足:当数据中有极端值时,不宜使用算术平均数。(截尾平均数)当数据不同质时,不宜使用算术平均数。1.截尾平均数:又称修剪平均数(trimmed mean)是从一组数据中去除一定百分比(如5%)的最大值和最小值数据后,再次计算的算术平均数。2.同质:同一种测量工具所测量的某一特质 。七、计算和应用算术平均数的原则同质性原则:算术平均数只能用于表示同类数据的集中趋势。平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程度。二、中位数的计算方法52 名学生数学成绩频数分布表三、中位数的特点与应用中位数是根据全部数据的个数来确定其位置的,意义简明,对按顺序排列的数据来讲,计算中位数也比较容易。中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。一般用于下列情况:一...