L/O/G/O2012年3月20日数据分析——描述统计数据分析——描述统计x前言前言•在做数据分析的时候,一般首先要对数据进行描述性统计分析,以便于描述测量样本的各种特征及其所代表的总体的特征以及发现其数据的内在规律,再选择进一步分析的方法
•描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形
目录目录集中趋势离散趋势探索分析集中趋势集中趋势•定义在统计学中是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在
•度量方法集中趋势的度量包括了均值(mean),中位数(median),众数(mode)
均值、中位数、众数用那一个去度量平均水平呢
均值、中位数、众数的渊源均值、中位数、众数的渊源定义均值:表示一系列数据或统计总体的平均特征的值中位数:将总体单位的某一数量标志的各个数值按照大小顺序排列,居于中间位置的那个数值就是中位数
众数:众数是指变量数列中出现次数最多或频率最大的变量值
众数、中位数、算术平均数的比较众数、中位数、算术平均数的比较1
众数、中位数、算术平均数的比较众数、中位数、算术平均数的比较均值比中位数、众数对数据的概括能力要强
相对于中位数和众数而言均值对数据的灵敏度较大
均值比中位数、众数偏于计算和分析
均值的抗耐性较差,极容易受个别和少数极端值的影响
均值适用范围比中位数、众数窄
众数、中位数、算术平均数数值关系2
众数、中位数、算术平均数数值关系•(一)对称分布情况下•(二)偏态分布情况下数据类型与集中趋势测度值数据类型与集中趋势测度值※为该数据类型最适合用的测度值
均值、中位数、众数的代表性衡量及使用均值、中位数、众数的代表性衡量及使用•前面我们知道均值、中位数、众数的定义不同,特点和适