第六章假设检验6.1假设检验的基本问题一、假设检验的陈述在自然科学和社会科学研究中,经常要提出一些假设,然后要判断或检验这些假设是否正确。例如我们在用反证法证明数学命题或题目时,需要做一个假设,然后利用已有的知识和命题的条件推导出矛盾来,从而否定所做的假设,证明了原命题的正确性。在用统计学研究问题时,也经常根据实际问题提出假设,然后利用样本统计量判断假设是否正确的过程,这就是假设检验。为了讲清楚这个内容,我们先介绍假设检验的有关知识。1、小概率事件不发生原理小概率事件(发生概率小于0.1的事件)发生的概率很小,在一次试验中认为它不发生。例如我们知道人们乘车都有发生交通事故的可能,但是人们依据小概率事件在一次试验中不发生原理,照样乘车、乘飞机等。2、假设检验问题的提出在用统计学研究自然科学和社会科学问题时,有时提出一个假设,这个假设称为原假设,然后依据小概率事件在一次试验中不发生原理,检验这个假设正确与否。例1某超市从厂家进货,双方达成协议,如果次品率超过1%,则超市拒收货物,今有一批货物,随机抽取200件检查,发现有次品3件,在显著性水平下,试问超市是否要接受这批货物?作为超市来说,可以提出一个假设:次品率小于或等于1%,再抽取样本,检验这个假设对不对,若假设成立,就允许这批货物进入超市,相反,若假设不成立,就拒绝这批货物进入超市。现在问题的关键在于如何判断这批货物的次品率是否超过1%,有些同学可能会说可以抽一部分0.05货物进行检测一下,看看这部货物次品率是否超过1%,由于你抽取的货物是随机的,因此所抽查货物的次品率也是随机的。为此,我们假定前面的假设是正确的,在这基础上计算题目中的事件A:“随机抽取产品中次品率不超过1%”发生的概率。(1)在(1)式中,z正好是统计量,并且其分布是标准正态60.010.01200(){}(1)0.01(10.01)200{2.619}0.0044pPAPzppnPz分布,计算结果及示意图是y0.00442.61x从(1)的计算结果可以看出,在超市提出的假设成立的情况下,随机抽取的200件产品中,有6件是次品的概率为0.0044,显然这是一个小概率事件,认为在一次抽查中不应该发生,现在它发生了,我们怀疑超市提出的假设不应该成立。也就是拒绝这批产品进入超市。在这个例子中,超市提出了假设,通过抽样获得样本数据和统计量的分布,计算出这个假设成立的概率很小,是小概率事件,再根据小概率事件在一次试验中不发生原理,拒绝了产品进入超市。这个过程就是统计学中重要内容——假设检验。3、原假设和备择假设原假设(nullhypothesis):指研究者想收集证据予以反驳的假设。通常用表示。备择假设(alternativehypothesis):指研究者想收集证据予以支持的假设。通常用表示。例如在例1中,“次品率小于或等于1%”是超市想反驳的假设,是原假设。它的对立面“次品率大于1%”是超市想支持的假设,是备择假设。4、两类错误和显著性水平第一类错误:原假设是真的,但在检验中被错误地拒绝了。第二类错误:原假设是假时,没有拒绝而错误地被接受了。0H1H这两类错误之间的关系是:在样本容量一定时,犯第一类错误概率较大时,犯第二类错误地概率较小;反之,犯第一类错误概率较小时,犯第二类错误概率较大。要想两类错误的概率都减小,只有增加样本容量。5、显著性水平显著性水平:是指人们犯第一类错误概率的最大允许值。注意:显著性水平是人们根据自己所研究的问题来确定,在经济学和其他社会科学中,常用选择的显著性水平是5%,或者10%,在卫生和医药统计中,常用选择的显著性水平是1%。在我们经济学中,除非特别声明,一般都以5%作为显著性水平。6、临界值和拒绝域拒绝域:拒绝域就是由显著性水平所围城的区域。临界值:由给定的显著性水平确定的拒绝域的边界值,称为临界值。实际上临界值就是分位点所对应的值。例2某地区小麦的一般生产水平是亩产250公斤,其标准差是6公斤。现在经过品种改良试验,从25个小区抽样,结果为小麦平均亩产比原来提高20公斤。对检验假设,的问题,求时,不犯第二类错误的概率。假设小麦亩产服从正态分布()。解:该地区小麦的一般...