答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数
均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述
几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometricmean)
几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料
中位数和百分位数:中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表示
理论上数据集中有一半数比中位数小,另一半比中位数大
中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述
所谓“开口”资料,是指数据的一端或者两端有不确定值
百分位数(percentile)是一种位置指标,以PX表示,一个百分位数PX将全部观察值分为两个部分,理论上有X%的观察值比PX小,有(100-X)%观察值比PX大
故百分位数是一个界值,也是分布数列的一百等份分割值
显然,中位数即是P50分位数
即中位数是一特定的百分位数
常用于制定偏态分布资料的正常值范围
答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用
极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差
极差大,说明资料的离散程度大
用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等
其缺点是:1
四分位数间距(inter-quartilerange)就是上四分位数与下四分位数之差,即:Q=QU-QL,其间包含了全部观察值的一半
所以四分位数间距又可看成中间一半观察值的极差