样本含量估算方法及其软件实现(一) 样本含量(sample size)即观察例数的多少,又称样本大小
在保证研究结论具有一定的可靠性(精度和检验功效)的前提下,常需要在设计阶段就人估计最少的受试对象
在医学科研中,只要是抽样研究,就要考虑样本含量的估计
样本含量估计充分反映了科研设计中“重复”的基本原则,过小过大都有其弊端
样本含量过小,所得指标不稳定,用于推断总体的精密度和准确度差;检验的功效性低,应有的差别不能显示出来,难以获得正确的研究结果,结论也缺乏充分的证据;样本含量过大,会整加实际工作的困难,浪费人力、物力、财力和时间
由于过分追求数量,可能会引起更多的混杂因素,从而影响数据的质量
影响假设检验时样本含量估计的因素有四个: 1
第一类错误概率的大小α 也称检验水准
α 越小所需样本含量越多,对于相同α ,双侧检验比单侧检验所需要的样本含量更多
检验功效(1-β )或第二类错误概率的大小β 检验功效越大,第二类错误的概率愈小,所需要样本含量愈多
容许误差δ 容许误差δ 愈大,所需的样本含量愈小
总体标准差ζ 或总体概率 ζ 愈大,所需样本含量自然愈多
总体概率越接近 0
5,则所需样本含量愈多
样本含量的估算方法有查表法和计算法两种
随着计算机的普遍使用,统计学家也开发了一些专门的样本含量估算软件
其算法都是根据上述影响因素结合统计学原理求得
我就通过实例的样本含量的计算过程,使大家对样本含量有一个更加直观的认识
1 计量资料单组设计基于 t 检验的差异性检验 举例:已知中国 50-70 岁男性的平均收缩压为 158 mmHg,标准差为 18,用药物AAA 干预,平均收缩压下降 10 mmHg 则认为有临床意义,α=0
05, Power=90%,Pow er =1-β, 双侧检验,需要多少病例数
启动医学研究样本含量估算系统 SAS