用样本估计总体 在上节课中,我们知道在选取样本时应注意的问题,其一是所选取的样本必须具有代表性,其二是所选取的样本的容量应该足够大,这样的样本才能反映总体的特性,所选取的样本才比较可靠 . 一、 随机抽样调查是了解总体情况的一种重要的数学方法,抽样是它的一个关键,上节课介绍了简单的随机抽样方法,即用抽签的方法来选取样本,这使每个个体都有相等的机会被选入样本. 让我们仍以上一节 300 名学生的考试成绩为例,考察一下抽样调查的结果是否与总体的情况一致。 首先对总体情况进行分析,根据已知数据,按照 10 分的距离将成绩分段,统计每个分数段学生出现的频数,填入表 30.2.1表 30.2.1 300 名学生考试成绩频数分布表成绩段39.5 ~49.549.5 ~59.559.5 ~69.569.5 ~79.579.5 ~89.589.5 ~100频 数1962859647这就是频数分布表根据上表绘制直方图,如图30.2.1300 名学生成绩频数分布直方图总体的平均成绩为 78.1 ,标准差为 10.8分 从图表中可以清楚地看出 79.5 分到 89.5 分这个分数段的学生数最多, 90 分以上的同学较少,不及格的学生数最少。 这就是频率分布直方图 活动 1 中,我们用简单的随机抽样方法,已经得到了第一个样本,这 5 个随机数如下表:随机数( 学号)11125416794276成绩8086669167 图 30.2.2 是这个样本的频数分布直方图、平均成绩和标准差。重复上述步骤,再取第二和第三个样本。它的频数分布直方图、平均成绩和标准差分别如下:5 名学生成绩频数分布直方图第一样本样本平均成绩为 78 分,标准差为 10.1 分 图 30.2.2另外,同学们也分别选取了一些样本,它们同样也包含五个个体,如下表:随机数(学号)13224559889成绩7873766975同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成绩和标准差,如下图所示: 随机数(学号)901678627554成绩7286838282样本平均成绩为 80.8 分,标准差为 6.5分样本平均成绩为74.2 分,标准差为 3.8 分 5 名学生成绩频数分布直方图第二样本第三样本5 名学生成绩频数分布直方图图 30.2.3 从以上三张图比较来看,它们之间存在明显的差异,平均数和标准差与总体的平均数与标准差也相去甚远,显然这样选择的样本不能反映总体的特性,是不可靠的。10 名学生成绩频数分布直方图10 名学生成绩频数分布直方图第一样本第一样本样本平均成绩为 79.7 分,标准差为 9.4分 让我们再用大一些的样本试一试,...