1 频率分布表庖丁巧解牛知识·巧学 一、样本的频率分布概念 当总体很大或不便获得总体的频率时,可以用样本的频率分布估计总体的频率分布
根据所抽取样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值情况)就叫做样本的频率分布
二、样本频率分布表的编制方法 为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,这样的表就叫样本频率分布表
编制频率分布表的步骤:(1)求极差(也称求全距,即一组数据的最大值与最小值的差)
(2)决定组距与组数(组距的选择应力求“取整”,如果极差不利于取整即不能被组数整除,可适当增大极差,如在左右各增加适当的范围)
(3)决定分点,将数据分组(分组时常对各组数值取左闭右开区间,最后一组取闭区间)
(4)登记频数、计算频率列出频率分布表(频率=频数/样本容量)
联想发散 组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况
分组的组数与样本容量有关,一般样本容量越大,所分组数越多
根据样本容量的大小,通常将数据分成 5—12 组
组数的“取舍”不依据四舍五入,而是当不是整数时,组数=[]+1
0,极差为 4
1,则组数===4
1,也就是说组数为 5
如果数据比较多,人工无法迅速处理时,在求极差和计算频数时可借助于计算机很方便地进行
频率分布表排除了抽样造成的误差,精确地反映了总体取值的频率分布规律(总体分布)
三、样本频率分布与总体分布的关系 1
样本中某数据的频数和样本容量的比,就是该数据的频率
所有数据的频率分布变化规律叫做样本频率分布
总体取值的可能性分布规律叫做总体可能性分布,简称总体分布,由于总体取值分布通常不易知道,因此往往是从总体中抽取一个样本