ROC 曲线的应用措施 1ROC 曲线的基本思想及应用 评价诊断试验有效性的常用指标为灵敏度 Se 和特异度 Sp[4],但评价中尚存在下列问题:对数值变量或有序分类变量,当诊断界值发生变化时,灵敏度和特异度分别朝着不同的方向变化,因此单纯用某一点上的灵敏度和特异度指标比较和评价几种诊断系统的诊断效能是不全面的;当一种方法的灵敏度高而另一种方法的特异度高时,则很难对两者进行比较;传统的灵敏度和特异度指标比较,未考虑医师的诊断水平、置信水平和临界值的选取等混杂因子的存在。因此,只有对不同的诊断界值下的灵敏度—特异度曲线进行全面的比较,才能比较客观地反映诊断系统的效能。ROC 曲线分析的本质就是动态分析、比较不同诊断试验在多个诊断界值条件下,对应的灵敏度特异度曲线的差异[5]。对于非二分类的诊断结果 Y,我们通过选择临界值 C(又称截割点 cutoffpoint)进行二分类,定义 Y≥C 为阳性结果。ROC 曲线即是在所有可能的临界值范围内运用该原理,将真阳率和假阳率(1真阴率)联系起来的一种线图。ROC 曲线下的面积表示诊断系统中阳性和阴性诊断结果分布的重叠程度,反映了诊断试验价值的大小。面积越凸说明诊断价值越高,因此,可以通过比较曲线下面积的大小评价多个诊断试验。同时,根据曲线拐点,可选取理论上最合适的截割点[6,7],使试验的灵敏度和特异度达到最优。另外,ROC 曲线分析还可评价判别模型诊断效果[8]。从 1982 年 Swets 和 Pickett 将 ROC 分析应用于诊断试验到现在,该方法已成为生物医学中描述诊断试验准确性的最流行的一种技术。 2ROC 曲线分析方法 2.1ROC 曲线下的面积计算 2.1.1 参数法 Bamber[9]于 1975 年提出以不等边四边形理论(trapezoidalrule)为基础的 ROC 曲线下面积计算公式:A=k1∑j=1P(T=j|D=0)k∑i=j+1P(T=l|D=1)+12k∑k=1P(T=k|D=0)P(T=k|D=1)。国内有人提出用累积比数模型[10],将真实病情(参照金标准)D 看作解释变量,待评估的诊断试验作为反应变量,用于小样本的 ROC 曲线下面积计算。 2.1.2 非参数法包括 Wilcoxon 统计量思想(HanleyJA,1982年),MannWhitney 和 KolmogorovSmirnov 统计量[11]。Hanley[3]于1982 年提出在资料分布未知的情况下 ROC 曲线下面积的计算方法,引用了非参数检验方法中 Wilcoxon 统计量的思想,将各截割点看作可依次排序的秩项,列出计算表,估量曲线下的面积及其标准误,W=1nAnNnA∑1nN∑1S(xA,xN)。最近又相继有人提出了在确诊偏性存在条件下[...