第九章偏倚及其控制BiasesandTheirControl1、研究结果的变异性2、研究的真实性3、研究的偏倚第一节研究结果的变异性一、概述变异性(variability):研究结果的变动或波动叫研究结果的变异性1、生物学变异和测量变异:主要来自个体(个体生物学变异;测量误差)、群体(个体遗传学变异、环境变异测量误差)和样本(抽样方式、样本大小和测量误差)2、随机变异和系统变异:前者成正态分布;后者的绝对值和方向保持恒定。测量误差包括随机误差和系统误差二、个体水平差异变异来源特点个体状态日间变异,年龄、膳食或运动改变,环境因素测量误差仪器标度差,精密度差,读数或记录错误三、群体水平的变异性•是各个体变异的累积,群体变异常大于个体•可根据群体变异来确定正常值的范围•也受到测量误差的影响四、样本水平的变异性1、描述性结果样本变异:图8-12、分析性结果样本变异:图8-2第二节研究的真实性一、概述真实性(效度;validity):研究收集的数据、分析结果和所得结论与客观实际的符合程度。用真实性指数(indexofvalidity,IV)或灵敏度等表示。研究误差:研究结果与客观实际不符合的地方。分为系统误差(偏异;bias)和随机误差可靠性(信度;reliability;精密度;precision):指研究中随机误差的大小程度二、内部真实性(internalvalidity)•指研究结果与实际研究对象真实情况的符合程度,指研究本身是否真实•真实性高,则系统误差和随机误差小•研究结果真实性差,不能应用于其他人群三、外部真实性(externalvalidity)•研究结果与推论对象真实情况的符合程度•增加研究对象的同质性,能改善内部真实性;•增加研究对象的异质性,能改善外部真实性;•应综合考虑研究对象的异质性和同质性第三节研究的偏倚一、选择偏倚•定义:选入研究样本的研究对象与未被选入者之间特征差异造成的系统误差。描述性研究的选择偏倚:体现在样本对总体的代表性上分析性研究的选择偏倚:体现在研究对象进入、排除、不参与、失访等二、信息偏倚定义:在从研究对象收取所需信息时产生的偏倚。其表现是使研究对象的某种特征被错误分类(misclassification)。同样存在描述性研究和分析性研究的中无差异性错误分类(nondifferentialmisclassification):暴露或疾病的错误分类与研究分组无关;大多数情况下,模糊了组间差异,低估了研究效应差异性错误分类(differentialmisclassification):暴露或疾病的错误分类与研究分组有关,由于其差异偏向不同,可高估或低估研究效应无差异分类错误高脂肪膳食低脂肪膳食心肌梗死6040对照4060高脂肪膳食低脂肪膳食心肌梗死4852对照3268高脂肪膳食低脂肪膳食心肌梗死6040对照4060高脂肪膳食低脂肪膳食心肌梗死6040对照3268研究真实数据错误分类数据研究真实数据差异分类错误错误分类数据OR=2.3OR=2.0OR=2.3OR=3.2三、混杂偏倚定义:在研究某因素与某疾病关联时,由于某个既与疾病有制约关系,又与所研究的因素有联系的外来因素的影响,掩盖或扩大了所研究的因素与疾病的联系,这种现象或影响叫混杂(confounding),其所带来的偏倚叫混杂偏倚(confoundingbias),该外来因素叫混杂因素(confoundingfactor)。特点:(1)必须是所研究疾病的独立危险因子(2)必须与研究因素(暴露因素)有关(3)必须不是研究因素与研究疾病因果链上中间变量由统计学关联到因果关联(一)统计学关联(association)偶然关联选择偏倚提出验证关非因果关联观察偏倚假设假设联混杂等统计学关联间接因果关联因果关联直接因果关联(二)因果关联(causalassociation)黄色瘤(E)静脉吸毒(E)1、继发2、直接关联高血清胆?关联性乱(F)?胆固醇(C)歪曲冠心病(D)HIV感染(D)病因推断四、混杂偏倚的分层分析M-H(Mantel-Haenszel)分层分析方法的步骤对可能的混杂因素进行分层判定层间RR或OR是否相等或相近得到控制混杂后的调整RR或OR再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较1.队列研究(1)累计发病率资料表9-3以累计发病率为研究指标的队列研究新病例未发病合计暴露组aibiN1i非暴露组cidiN0i合计M1iM0iTi2221010//1iiiiiMHiiiiiiadbcTNN...