第一章数据的描述和整理一、学习目的和要求1
掌握数据的类型及特性;2
掌握定性和定量数据的整理步骤、显示方法;3
掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4
能理解并熟练掌握样本均值、样本方差的计算;5
了解统计图形和统计表的表示及意义;6
了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算
二、内容提要(一)数据的分类数据类型定性数据(品质数据)定量数据定类数据(计数数据)定序数据(等级数据)数值数据(计量数据)表现形式类别(无序)类别(有序)数值(+-×÷)对应变量定类变量定序变量数值变量(离散变量、连续变量)主要统计方法计算各组频数,进行列联表分析、2检验等非参数方法计算各种统计量,进行参数估计和检验、回归分析、方差分析等参数方法常用统计图形条形图,圆形图(饼图)直方图,折线图,散点图,茎叶图,箱形图(二)常用统计量1、描述集中趋势的统计量名称公式(原始数据)公式(分组数据)意义均值反映数据取值的平均水平,是描述数据分布集中趋势的最主要测度值,1中位数Me中位数所在组:累积频数超过n/2的那个最低组是典型的位置平均数,不受极端值的影响众数Mo数据中出现次数最多的观察值众数所在组:频数最大的组测度定性数据集中趋势,对于定量数据意义不大2、描述离散程度的统计量名称公式(原始数据)公式(分组数据)意义极差RR=最大值-最小值R≈最高组上限值-最低组下限值反映离散程度的最简单测度值,不能反映中间数据的离散性总体方差2反映每个总体数据偏离其总体均值的平均程度,是离散程度的最重要测度值,其中标准差具有与观察值数据相同的量纲总体标准差样本方差S2反映每个样本数据偏离其样本均值的平均程度,是离散程度的最重要测度值,其中标准差具有与观察值数据相同的量纲样本标准差S变异系数CVCV=反映数据偏离其均值的相对偏差,是无量纲的相对变异性测度样本标