2用样本估计总体——教材解读用随机抽样的方法获得样本,我们就会得到一组数据,统计思想的本质就是用样本估计总体
用样本估计总体,一般有两种方法:一是用样本的频率分布估计总体分布;二是用样本的数字特征估计总体的数字特征
一、用样本的频率分布估计总体分布1.频数、频率将一批数据按照要求分为若干组,各组内数据的个数叫做该组的频数;每组数除以全体数据的个数的值叫做该组的频率
频率反映数据在每组中所占比例的大小
2.频率分布根据随机所抽样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布
为了直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,叫做样本频率分布表
3.用样本的频率分布估计总体分布从一个总体中得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所包含的信息,如果知道了这些数据的频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况
用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用用样本的频率分布对它进行估计
4.频率分布直方图作频率分布直方图的具体步骤:(1)计算极差:最大值与最小值的差
(2)决定组距与组数:组距与组数的确定没有固定标准,需要尝试、选择,力求有合适的组数,以能把数据的规律较清楚地呈现为准,太多或太少都不好,不利对数据规律的发现
组数应与样本的容量有关,样本容量越大,组数越多,如果数据的容量不超过100时,按数据多少,通常分为5~12组
(3)决定分点:分点要比数据多一位小数,便于分组,分组区间采用左闭右开,避免数据被重复计算
(4)列频率分布表:一般分“分组”、“频数累计”(可省略)、“频数”、“频率”四列,最后一行是“合计”
用心爱心专心注意:频数的合计应是样本容量,频率合计应是1