第五章假设检验导论:单样本的z检验A基本概念•零假设检验•统计决定•一类错误和二类错误•单侧检验和双侧检验•在前四章中,我们对描述性统计做了介绍。特别是通过z分数我们可以计算个体在总体分布中的位置和样本在抽样分布中的位置。换句话说,我们可以描述个体或者样本的特殊性。•那么处于怎样的位置才算是特殊呢?这种特殊性有怎么来验证呢?•这些问题是假设检验所要解决的问题。•最简单的假设检验是将一组被试与总体进行比较,且总体均数和标准差已知。•举个例子,硕士研究生考试包含笔试和面试,面试在最终录取中起到了很大的作用,因为导师更看重素质而不是分数。•有个导师声称,他的眼光很准,他可以看一下学生的眼睛,就能找到好的学生。我们要对他的说话进行验证。•如果我们用智商来代表一个学生的素质(尽管可能并不合适),那么刚才的问题就变成了那个导师可以通过看学生的眼睛来判断他的智商。•我们可以通过如下方式进行检验:让他通过自己的方式挑出25个学生,然后比较这些学生的智商是否真的较高。被试组选择•要验证该导师的说法,我们要让他选25个他认为高智商的同学,但是这种选择需要加以限制。•如果该导师直接奔向基地班,那这种选择显然是无效的。可选择的办法是,把学校所有学生的照片都找来,让其通过相貌来确定。•这样学校的每一个学生都有相同的机会被选到,而且每一次选取独立于其他的选取。也就是遵循随机取样的原则。•如果该导师选出的学生的平均智商确实高于总体平均,我们能否确认他确实眼光很准呢?•答案是不能。原因在于,我们随便找一个人去选,选出的学生的平均智商都不太可能等于总体平均数。从均数的抽样分布,我们可以得知,高于总体平均数的可能占50%。•也就是说该导师选出的学生平均智商高于总体均数的原因可能是随机因素。•这时,我们可以先做出一个假设,对其进行验证:选取学生的平均智商并不显著高于总体均数,其差异是随机抽样产生的,并不涉及一个特别的选择过程。这就是零假设检验。•接下来,我们要做的就是随机选取25个学生测其智商,重复n次,看有多少次能选到比那个导师选取的学生平均智商更高。也就是确定其概率。•上述的做法会得到智商均数的一个分布,由于这个分布显示的是零假设(没有特殊操作,随机选取)为真时发生的情况,因此被称为零假设分布。•在单样本检验且总体标准差已知的情况下,这个零假设分布就是均数的抽样分布。•通过这个零假设分布,我们可以算出选出比那个导师选择的学生组平均智商更高的概率是多少。•通过z分数来计算,比如该导师选取的25个学生平均智商为104,总体均数为100,标准差为15.那么•查表可知,对应的概率为0.0918。这个概率是通过随机选择而得到该分数的概率,被称为p值。33.125/15100104z统计决定•算出其概率之后,我们要做的是做出个统计推断。•因为推断的做出是基于概率的,如果要得到该导师的选择是无效的,也就是说该组学生的平均智商高于总体是随机抽样造成的,我们需要冒一定的风险。小概率事件也时有发生。•我们需要承担的这个风险量被称为α水平。α是我们愿意承担的零假设成立的概率。如果实际算出的概率要低于α,那么我将会拒绝零假设。•心理学中,每20次中有1次机会能抽到的α水平被认为是能接受的最大风险值。也就是0.05.•如果采用0.05的α水平,且实验p值小于0.05,那么我们可以再0.05的显著水平上拒绝零假设。也就说,那位导师的眼光显著好于一般人。•如果p大于0.05,我们会认为那位导师的挑选完全无效吗?一般情况下,我们会说没能拒绝零假设(证据不足)。这是数学家Fisher的观点:认为我们要么拒绝零假设,要么保留做出决定的权利。•而Neyman和Pearson则认为,应该提出与零假设互补的备择假设,因此拒绝其中一个就表明倾向于接受另一个。•在上边的例子中,我们把智商转换成了z分数,然后进行统计检验。这种情况下,z分数被称为检验统计量。(后边我们还会讲到t分布)。•检验统计量的分布被认为是零假设分布。•Z分数越大,p值越小,差异越显著。一类错误和二类错误•前面提到,如果p值远小于0.05,我们拒绝了零假设,但我们还是要承担...