什么是箱线图 什么是箱线图 箱线图在文献中经常见到,是对数据分布的一种常用表示方法。但是所见资料中往往说的不是特别清楚,因此需要了解一下箱线图的绘制过程,与部分的意义。 计算过程: 1 计算上四分位数,中位数,下四分位数 2 计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range) 3 绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中位数的位置绘制横线。 4 大于上四分位数1.5 倍四分位数差的值,或者小于下四分位数1.5 倍四分位数差的值,划为异常值(outliers)。 5 异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱线图的触须。 6 极端异常值,即超出四分位数差 3 倍距离的异常值,用实心点表示;较为温和的异常值,即处于 1.5 倍-3 倍四分位数差之间的异常值,用空心点表示。 7 为箱线图添加名称,数轴等。 在SPSS,SigmaPlot, R,SPlus,Origin 等软件中,绘制箱线图非常方便。 下面是R 中的一个箱线图举例 箱线图举例: 在R 软件中输入如下命令: x<-c(25, 45, 50, 54, 55, 61, 64, 68, 72, 75, 75,78, 79, 81, 83, 84, 84, 84, 85, 86, 86, 86, 87, 89, 89, 89, 90, 91, 91, 92, 100) boxplot(x) 对c 向量绘制箱线图。 箱线图(Box plot) 箱线图概述 箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。 [编辑] 箱线图的绘制步骤[1] (1)画数轴 (2)画矩形盒 两端边的位置分别对应数据的上下四分位数矩形盒:端边的位置分别对应数据的上下四分位数(Q1 和 Q3)。在矩形盒内部中位数位置画一条线段为中位线。 (3)在Q3+15IQR 和Q1-15IQR处画两条与中位线一样的(3)在Q3+1.5IQR和Q11.5IQR处画两条与中位线样的线段,这两条线段为异常值截断点,称其为内限;在 Q3+3IQR 和 Q1-3IQR 处画两条线段,称其为外限。处于内限以外位置的点表示的数据都是异常值,其中在内限与外限之间的异常值为温和的异常值(mild outliers),在外限以外的为极端的异常值(li)的异常值extreme outliers。 (4)从矩形盒两端边向外各画一条线段直到不是异常值的最远点 表示该批数据正常...