分类器的评估张英混淆矩阵与分类准确率多分类问题的混淆矩阵预测结果类c1c2……ck总实际类c1c2……ck总n准确率误分类率分类模型的评价指标1
准确率与误分类率准确率=(tp+tn))/(tp+fn+fp+tn)误分类率=(fn+fp)/(tp+fn+fp+tn)真正率(灵敏度)=tp/(tp+fn)真负率(特指度)=tn/(fp+tn)假正率=fp/(fp+tn)假负率=fn/(tp+fn)二分类问题的混淆矩阵预测结果类+-总实际类+tpfntp+fn-fptnfp+tn总tp+fpfn+tntp+fn+fp+tn不平衡分布类二类分类问题的混淆矩阵预测结果类+10-90实际类+5++(tp)3+-(fn)2-95-+(fp)7—(tn)88误分类率:9%真正率:60%评估指标2
精度P=tp/(tp+fp)3
召回率(真正率、灵敏度)R=tp/(tp+fn)4
FSCORE精度和召回率的调和均值:召回率和精度的权重相同:F=2RP/(R+P)将召回率的权重设为精度的β倍:二分类问题的混淆矩阵预测结果类+-总实际类+tpfntp+fn-fptnfp+tn总tp+fpfn+tntp+fn+fp+tn评估指标二分类问题的误分类代价预测结果类+-总实际类+C(+,+)C(+,-)C(+,+)*TP+C(+,-)*FN-C(-,+)C(-,-)C(-,+)*FP+C(-,-)*TN5
误分类代价(成本或收益)•误分类代价对称C(+,+)=C(-,-)=0C(+,-)=C(-,+)=1•误分类代价不对称关注预测为正类•成本角度•收益角度二分类问题的混淆矩阵预测结果类+-总实际类+tpfntp+fn-fptnfp+tn预测性能评估指标的选择•平衡分布类,对称误分类代价准确率、误分类率,精度•不平衡分布类,对称误分类代价精度,召回率,FSCORE•不对称误分类代价成本或收益模型评估方法