1 统计功效与效应量 华中师范大学心理学院 刘华山 一、统计功效(检验功效,效力,Power) 统计功效指某检验能够正确地拒绝一个错误的虚无假设的能力
用1-β表示
或说:当总体实际上存在差异(备择假设 H1 为真),应该拒绝虚无假设时,正确地拒绝虚无假设的概率,或不犯β 错误的概率
它表示某个检验探查出实际存在的差异,正确拒绝虚无假设的能力
在实验设计中,统计功效反映了假设检验能够正确侦查到真实的处理效应的能力
统计功效的大小取决于四个条件: 1
当两总体实有差异越大,或处理效应越大,则假设检验的统计功效越大;(在 α 错误概率不变的情况下,1-β 变大) 2
显著性标准 α:也称显著性水平,是一个特定的值,一个决策标准
通过p与 α 的决策比较,作出统计决策
而当假设 H0 是真实的时候,观察到的差异完全是由随机误差所致的概率称为观察概率 p
显著性标准 α 越大,则β 错误越小,从而统计功效 1-β 越大;反之,α 变小,1-β 变小 3
检验的方向:当两总体差异一定,对于同样的显著性标准 α,单侧检验比双侧检验的统计功效要大
样本容量越大,样本平均数分布的标准误越小,分布曲线越瘦削,统计功效越大
◆ 单总体检验 ◆ α 错误的解释 ◆ β 错误的解释 ◆ 统计功效 1-β ◆ 决定统计功效的条件 2 二、效应量 (效应大小,Effect Siz e,ES ) 效应量,反映处理效应大小的度量
效应量表示两个总体分布的重叠程度
ES 越大,表示两总体重叠的程度越小,效应越明显
其实,两样本平均数的差异本身就是一个效应量
由计算出的ES 大小,可由专门的表格中查出两样本分布的重叠的百分比
故效应量经常用两总体重叠的程度为指标,重叠的部分百分比越大,效应量越小
或以两个样本不重叠的程度为指标,不重叠的部分百分比越大,效应量越大