效标效度(Criterion validity)
目录 |
所谓效标效度,就是考查测验分数与效标的关系,看测验对我们感兴趣的行为预测得如何。因为效标效度需要有实际证据,所以又叫实证效度。
根据搜集效标的时间,可以将效标效度分为预测效度和同时效度。
1.同时效度同时效度的效标资料是与测验分数同时搜集的。例如大学入学考试可以用中学成绩作效标。同时效度常用的效标是在校的学业成绩、教师的等级评定、临床检查等。
2.预测效度
预测效度的效标资料需要过一段时间才可搜集到。此种效度对人员的选拔和安置工作非常重要。常用的效标是专业训练的成绩、实际工作的表现等。
所谓效标指的是衡量测验有效性的外在标准,通常是指我们所要预测的行为。
可以用来作为效标的变量有很多。效标可以是连续变量(如分数),也可以是分类变量(如 职业);可以是然的现成的指标(如产量、薪水),也可以是人为设计的指标(如课堂测验);可以是主观评判,也可以是客观测量。归纳起来,常见的效标主要有学业成就、等级评定、临床诊断、特殊训练成绩、实际工作表现、对团体的区分、其他测验成绩。
阿斯汀(a.w.astin)将效标分为观念效标和效标测量。观念效标是一个概念,效标测量则是对观念效标的数量化。例如:对于大学入学考试来说,我们感兴趣的是“大学学习的成功”,这是观念效标,而大学的学习成绩,则是效标测量。如果无效标测量,观念效标是毫无用处的。
好的效标测量应符合以下几个条件:
①效标测量必须真实地反映观念效标的重要侧面;
②效标测量必须稳定可靠;
③效标测量必须客观,避免偏见;
④在保证有效性的前提下,效标测量必须尽可能简单、省时、花费少。
效标效度一般可以通过统计分析得到一个数量指标,因此有人又叫它统计效度。常用的估计方法有相关法、分组法、预期表法等。
确定效标效度最常用的方法是计算测验分数与效标测量的相关。根据变量的性质不同,可分别采用积差相关法、等级相关法、二列相关法等。相关法的优点是:
①提供了预测源与效标间的数量关系;②可利用回归方程式来预测每个人的效标分数。
相关法的缺点是:
①如果预测源与效标之间不是直线关系,便会低估测验的效度;②不能提供关于取舍正确性的指标。
确定效标效度的另一种方法是看测验分数能否区分由效标测量所定义的不同团体。例如在大学里,我们根据教师评定,把学生分为合格与不合格两组,然后回过头去查阅他们的高考分数,若两组在高考分数上有显著差异,那就可以认为高考是有效的,否则便认为是无效的。
预期表法是将预测源分数和效标分数制成双维图表,并将每个变量按水平分成若干档次,然后列出每个档次上的人数百分比。从预期表我们可以看出效标效度的高低。从右下角到左上角的对角线上各格中的数字越大,说明效标效度越高。