问题提出1.随机抽样有哪几种基本的抽样方法?2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.简单随机抽样、系统抽样、分层抽样.2.2.1用样本的频率分布估计总体分布频数:在总体(或样本)中,某个个体出现的次数叫做这个个体的频数。频率:某个个体的频数与总体(或样本)中所含个体的数量的比叫做这个个体的频率。性质:在总体(或样本)中,各个个体的频率之和等于1。【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2通过抽样我们得到了100户居民的某年的月平均用水量为了确定一个比较合理的标准a,必须先了解全市居民的日常用水量的分布情况。通过抽样调查了解居民的用水情况。课本66页表2-1思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?0.2~4.3(4.3-0.2)÷0.5=8.2思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].分组频数累计(划记)频数[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频数累计(划记)正正正正正正正正丅正正正正正正正正丅频数48152225146421004.画频数分布表思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?用样本的频率分布估计总体分布.思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?88%的居民月用水量在3t以下,可建议取a=3.思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?所得到的结论的统计意义3t这个标准一定能保证85%以上的居民用水不超标吗?不一定!原因1、样本只是总体的代表,并且具有随机性,不同的样本所得到的频率分布表和直方图是不同的。原因2、明年的用水情况与今年不可能完全一样,但应该大致一样。所得到的结论的统计意义一般的,统计得到的结果,是对于总体较为合理的估计或预测,但其误差应该控制在合理的范围之内。也正因为这样,统计结果的好坏,往往需要进一步的评价,或通过理论方法的检验,或通过实际应用的检验。思考8:对样本数据进行分组,其组数是由哪些因素确定的?对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.按统计原理,若样本的容量为n,分组数一般在(1+3.3lgn)附近选取.当样本容量不超过100时,按照数据的多少,常分成5~12组.思考9:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?第一步,求极差.(极差=样本数据中最大值与最小值的差)第二步,决定组距与组数.(设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1)第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格.(频数=样本数据落在各小组内的个数,频率=频数÷样本容...