单变量统计分析□ 描述统计:· 主要目的:用最简单的概括形式反映出大量数据资料所容纳的基本信息
· 基本方法:集中趋势分析、离散趋势分析□ 推论统计:· 主要目的:用样本中所得到的数据资料来推断总体的情况
· 基本方法:区间估计和假设检验等
一、单变量描述统计□频数分布与频率分布· 频数分布:分布在各个类别中的数据个数
(绝对数)· 频率分布:数据中不同取值的频数相对于总数的比率分布情况
(百分比 、相对数)➢适用范围: 定类、定序、定距、定比数据年龄(岁) 学生人数百分比1728185201910402052021312合计25100(n=25)某班学生的年龄分布□集中趋势分析· 集中趋势分析( central tendency analysis ):是指用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况
· 常见的集中趋势分析:平均数(均值)、众数、中位数➢ 算术均值( MEAN , AVERAGE )· 加总多个观察值,除以总观察量得到的数值· 适用于正态分布或者近似正态分布· 均数受特大值和特小值的影响,会偏大或偏小,故对偏态分布的资料,均数的代表性差,不适合描述偏态分布的集中趋势· 总体均数称为 µ ;样本均数称为①原始数据:② 单值分组数据:③ 组距分组数据➢ 众数· 众数( mode ):一组数据中出现次数最多的那个数值
●众数适用于所有类型数据,但主要用于测度分类数据的集中趋势●一个数据可以有两个或多个众数,故众数具有不唯一性的特点· ① 单值分组资料先在频数栏中找出最大的频数 , 然后找到最大频数所对应的标志值 , 这一标志值即为众数
➢例:如果在全班 30 个学生中, 20 个 18 岁的学生、 5 个 19 岁、 5 个 20 岁,则 18 是众数② 组距分组资料 ( 组中值法 )首先通过直接观察找出最高的频数 ,