思考与练习一、思考题1、 分类数据的图示方法,其中包括条形图、Pareto 图、对比条形图和饼图等
顺序数据除了上文提到的条形图、pareto 图、对比条形图、饼图之外还可以借助累积频数分布图和环形图来进行描述
2、 条形图、饼图、环形图、累积分布图、直方图、茎叶图、箱形图、散点图、线图、三维散点图、气泡图、雷达图等
3、 数据分组根据分组标志的不同可以分为单变量值分组和组距分组两种
根据组距不同还可以分为等距分组和不等距分组
4、 分组和编制频数分布表的具体步骤如下:第 1 步:排序
将变量根据一定的大小顺序进行排序,通常是由小至大的递增顺序,使用计算机软件进行整理时此步可以忽略
第 2 步:确定组数
一般与数据本身的特点及数据的多少有关
由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中
如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律
组数的确定应以能够显示数据的分布特征和规律为目的
一般情况下,一组数据所分的组数 K 不应少于 5 组且不多于 15 组,即 5< K<15
在实际分组时,也可以借助经验公式来确定组数 K,其中 n 为数据的个数,对结果四舍五入取整数即为组数
第 3 步:确定各组的组距
在组距分组中,一个组的最小值称为下限(low limit);一个组的最大值称为上限(upper limit),组距(class width)是一个组的上限与下限的差
组距可根据全部数据的最大值和最小值及所分的组数来确定,即,组距=(最大值—最小值)/组数
5、 饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于讨论结构性问题十分有用
环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示
饼图只能显示一个总体和样