变异系数、偏度、峰度的认识及应用一、变异系数1、名词解释:变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。简单来说就是:在表示离散程度上,标准差并不是全能的,当度量单位或平均数不同时,只能用变异系数了,它也是表示离散程度,是标准差与平均数的比值称为变异系数,记为C·V。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。2、计算公式变异系数C.V=(标准偏差SD÷平均值MN)×100%3、应用:例题:已知某良种猪场长白成年母猪平均体重为190kg,标准差为10.5kg,而大约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那一个体重变异程度大。此例观测值虽然都是体重,单位相同,但它们的平均数不相同,只能用变异系数来比较其变异程度的大小。由于,长白成年母猪体重的变异系数:C.V=10.5/190*100%=5.53%大约克成年母猪体重的变异系数:C.V=8.5/196*100%=4.34%所以,长白成年母猪体重的变异程度大于大约克成年母猪。二、偏度1、名词解释:偏度以bs表示,xi是样本测定值,是样本n次测定值的平均值。表征概率分布密度曲线相对于平均值不对称程度的特征数。2、偏度与与正态分布的关系:正态分布的偏度为0,两侧尾部长度对称。bs<0称分布具有负偏离,也称左偏态,此时数据位于均值左边的比位于右边的少,直观表现为左边的尾部相对于与右边的尾部要长,因为有少数变量值很小,使曲线左侧尾部拖得很长;bs>0称分布具有正偏离,也称右偏态,此时数据位于均值右边的比位于左边的少,直观表现为右边的尾部相对于与左边的尾部要长,因为有少数变量值很大,使曲线右侧尾部拖得很长;而bs接近0则可认为分布是对称的。若知道分布有可能在偏度上偏离正态分布时,可用偏离来检验分布的正态性。右偏时一般算术平均数>中位数>众数,左偏时相反,即众数>中位数>平均数。正态分布三者相等。3、计算方法:其中是第个样本,是样本标准差,是总体偏度的有偏估计。三、峰度1、名词解释:峰度,又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了尾部的厚度。2、特点:峰度以表示,是样本测定值,是样本n次测定值的平均值,s为样本标准差。正态分布的峰度为3。称分布具有不足的峰度,称分布具有过度的峰度。若知道分布有可能在峰度上偏离正态分布时,可用峰度来检验分布的正态性。3、计算方法:随机变量的峰度计算方法为:随机变量的四阶中心矩与方差平方的比值。某单位引体向上测试总体分布情况分析一、测试成绩(单位:个):三月份测试成绩:8、8、10、7、11、14、6、5、7、7、9、10、12、4、6、8、7、11、8、9、10、12、9、8、6、5、8、9、5、8、8、10、8、11五月份测试成绩:4、10、9、4、11、6、8、9、7、11、12、7、9、6、10、8、9、7、8、14、12、9、8、7、8、9、5、7、8、10、8、5、6、8、14二、数据分析:三月份:样本容量:样本均值:样本方差:13.34602五月份:样本容量:样本均值:样本方差:14.14776三、图像:如上图所示,其中横轴为引体向上的个数,纵轴为达到相同个数的频数。由上图可以发现,三月份我单位成员引体向上测试总体分布情况服从的正态分布;五月份我单位成员引体向上测试总体分布情况服从的正态分布。四、假设检验:现给定显著性水平,进行假设检验。提出原假设:统计量,.所以统计量的值