2.2.1 频率分布表庖丁巧解牛知识·巧学 一、样本的频率分布概念 当总体很大或不便获得总体的频率时,可以用样本的频率分布估计总体的频率分布.根据所抽取样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值情况)就叫做样本的频率分布.二、样本频率分布表的编制方法 为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,这样的表就叫样本频率分布表.编制频率分布表的步骤:(1)求极差(也称求全距,即一组数据的最大值与最小值的差).(2)决定组距与组数(组距的选择应力求“取整”,如果极差不利于取整即不能被组数整除,可适当增大极差,如在左右各增加适当的范围).(3)决定分点,将数据分组(分组时常对各组数值取左闭右开区间,最后一组取闭区间).(4)登记频数、计算频率列出频率分布表(频率=频数/样本容量). 联想发散 组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况.分组的组数与样本容量有关,一般样本容量越大,所分组数越多.根据样本容量的大小,通常将数据分成 5—12 组.组数的“取舍”不依据四舍五入,而是当不是整数时,组数=[]+1. 组距为 1.0,极差为 4.1,则组数===4.1,也就是说组数为 5. 如果数据比较多,人工无法迅速处理时,在求极差和计算频数时可借助于计算机很方便地进行.频率分布表排除了抽样造成的误差,精确地反映了总体取值的频率分布规律(总体分布).三、样本频率分布与总体分布的关系 1.样本中某数据的频数和样本容量的比,就是该数据的频率.所有数据的频率分布变化规律叫做样本频率分布. 2.总体取值的可能性分布规律叫做总体可能性分布,简称总体分布,由于总体取值分布通常不易知道,因此往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布. 3.样本频率分布是随着样本容量的增大更加接近总体分布,也就是说,样本的容量越大,这种估计就越精确. 4.对于样本,只读频率,不能跟总体的可能性混淆,若样本的容量越大,则频率越接近于可能性.四、随机变量与总体分布的联系 1.学习有关总体分布的知识,要注意把总体分布的概念与随机变量联系起来.比如,对于多次重复抛掷某一硬币的实验来说,每次抛掷硬币的结果,既可以看成是从很多这种试验结果组成的总体中抽取的一个个体值,还可以看成是在同一随机...