1 一组数据的分布特征可以从哪几个方面进行测度
数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态
5 简述众数、中位数和平均数的特点和应用场合
众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性
众数只有在数据量较多时才有意义,数据量较少时不宜使用
主要适合作为分类数据的集中趋势测度值
中位数是一组数据中间位置上的代表值,不受极端值的影响
当数据的分布偏斜较大时,使用中位数也许不错
主要适合作为顺序数据的集中趋势测度值
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛
当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数
但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数
7 标准分数有哪些用途
标准分数给出了一组数据中各数值的相对位置
在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理
它还可以用来推断一组数据是否有离群数据
3 怎样理解置信区间
置信区间:由样本统计量所构造的总体参数的估量区间7
4 解释 95%的置信区间
95%的置信区间指用某种方法构造的所有区间中有 95%的区间包含总体参数的真值
5 Za/2 的含义是什么含义:Za/2 是标准正态分布上侧面积为 a/2 的 z 值,公式是统计总体均值时的边际误差
6 解释独立样本和匹配样本的含义
独立样本:假如两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立
匹配样本:一个样本中的数据与另一个样本中的数据相对应
8 简述样本量与置信水平、总体方差、边际误差的关系
样本量越大置信水平越高,总体方差