计算机化自适应认知诊断测验选题研究
【摘要】:计算机技术在心理和教育测量领域的应用,促成了计算机化自适应测验(CAT)的诞生和快速发展。CAT因其能为考生打造“量体裁衣”式测验的优势,备受各方推崇。具有认知诊断功能的CAT(CD-CAT)是对CAT的扩展,它既具有认知诊断功能,能对被试的心理特质做结构化的细致测量,同时又兼具CAT的测验形式,可以提高对被试诊断测量的准确性和效率。因此近几十年来,CD-CAT在教育测量领域备受关注。
关于CD-CAT选题策略的研究并不在少数,但通常都认为认知诊断测验是低风险测验,所以传统的CD-CAT在判定选题策略优劣时,存在重测量精度轻平衡项目曝光度的倾向,即选题策略存在项目曝光不均匀问题,使某些项目被过度曝光,而某些项目曝光不足。于是使用频数高的项目过度曝光给测验题库的安全性带来威胁,而且因为有的项目使用频数低甚至根本不使用而导致测验题库资源的浪费。目前文献中,对于CD_CAT中如何控制项目曝光的研究并不多。针对上述问题,本文主要对DINA模型下CD-CAT的选题策略进行研究,提出了一种新的选题策略p-STR,在选题中加入了对项目曝光控制的因子,同时还对不定长CD-CAT略作探讨。本文采用蒙特卡洛模拟实验,对以下六种选题策略进行了比较研究:随机选题(RD)、香农熵法(SHE)、相对熵法(KL)、两种加权KL法和p-STR选题。一方面比较各方法的模式判准率;另一方面对各选题策略的项目调用均匀性进行研究。模拟研究表明,本文提出的p-STR选题方法,在选题速度、测量精度和项目调用均匀性上均表现良好。