浅谈语言测试试题设计的几个标准大学时学过语言测试这门课,现结合本次培训所学内容,肤浅的谈一谈在进行语言测试时试题设计的几个标准:(一)效度(testvalidity)效度就是测量的有效性,也就是看考试是否考查了想要考查的内容
语言测试能测出预定要测量的事物的程度,或能够引起预报作用的程度
“语言测试的效度,亦称有效性,指测试所考的,是否就是所要考的,或者说,在多大程度上,是考了目的所要考的”(李筱菊)
如:用作文考查写作能力就比用多项选择题有效
用听写考查听力,评分不当,考试有效性就会降低
有效性反映在测试的不同方面,验证有效性要通过多种途径收集数据
如:内容有效(考试内容的代表性,选择内容应广泛)、结构有效(试卷结构的合理性,兼顾语言内容和技能的各个方面)、共时有效(现行考试与以往成绩的关系,与教师掌握的情况相比较)、预测有效(考试成绩与学生以后发展的关系)、答题有效(学生答题情况:是否认真,是否作弊)等
(二)信度(reliability)信度(reliability)(又称一致性,consistency),指语言测试的测量结果一致性即考试结果准确、稳定、可靠的程度
要求由不同的评卷人阅卷,所得分数大致相同;同一个评卷人在不同时间阅卷,分数也大致相同
Henning列举了五项威胁测试信度的因素:(1)学习者的波动,如:临时的心理或生理的变化;(2)评分的波动,如:评分员之间、每个评分员自身前后之间的差异;(3)施测过程中的波动,如:外界的干扰、不同的指令;(4)测试的特征,如:测试时间的长短、试题的难易度、区分度;(5)与作答相关的错误,如:猜测因素等
Bachman和Palmer认为:“完全消除不一致性是不可能的”(Itisimpossibletoeliminateinconsistenciesentirely)
然而,如果我们遵循某些原则,确实可以最大程度的减少这些