高考数学总复习教程第1讲统计一、本讲进度二、学习指导统计就是通过对样本的研究来估计总体的相关情况
这种估计的可靠性,取决于两个方面:一是对样本恰当的采集,二是对样本进行适当的分析
1.在可能的情况下,样本容量越大越好.在确定样本容量后,对样本的采集的原则只有一条:公平性.即使每个个体被采入的概率相等(即若总体容量为N,样本容量为n,应使每个个体被采入的概率均为).为此,我们常用以下三种样本采集法:(1)简单随机抽样法.传统常用抽签法和随机数表法,一般适用于样本容量较小者
其中随机数表法初学者易产生一些误解,故应指出:①第二步中“任选一数”才能保证公平性,不必也不能每次都仿课本中例题那样选“5”,②课本例题中“向右”他是照顾阅读习惯而已,从理论上说,也可向左、向上、向下、向左下、向右上等方向,甚至可以有规律地“跳读”.但这不意味着“随意读”,如之类的读法,就人为地破坏了“公平性”.(前一句话中“有规律”的说法也是为了避免无意间破坏了这种“公平性”)③不需以为随机数表中两数一节,只适用于二位数,这只是便于你阅读的一种印刷方式而已,一位数,三位数等也适用;④统计工作者现在常用计算机来产生随机数,我们这两年耳熟能详“计算机派位”就是一例,又快又方便
(2)分层抽样.当总体由差异明显的几部分构成时,为了充分利用已有信息,同时也是为了更好地用样本估计总体,应采用分层抽样
但要注意:①每层中抽取的样本数应为n1·(n1为该层总个数,n为样本容量,N为总体个数);②在每层中应采用简单随机抽样
(3)系统抽样.当总体个数较多,且分成均衡的几个部分时,可采用系统抽样,这样省时省力,但应注意,在每个部分中的抽取规则必须对每一个体“公平”
2.用样本估计总体,一般应做如下几件事:(1)频率分布.先求样本数据中最大值与最小值的差,(称为极差),再确定合适的组数和组距,决定分点(每个分点只能属于一组,