基于文本相似度的主观题智能阅卷技术研究
【摘要】:目前,在国内外的各类测试中,简答、作文等常见的主观题形式,大多使用传统人工批改,评分质量具有很强的人为因素,且效率低下,很难做到客观公正。随着人工智能和自然语言处理技术的快速发展,主观题智能阅卷技术受到越来越多研究者重视,成为了教育技术领域的一个重要研究课题。近年来,人工智能技术的发展,特别是神经网络在文本相似度计算中的广泛应用,不仅提高了中文文本相似度的精度,也为主观题智能阅卷的发展,提高阅卷准确度方面提供了技术的可能。其中,依存句法结构的提出,解决了中文文本在语法和句法结构上的差异,不仅提高了中文文本的相似度计算的准确率,其技术的推广应用也促进了主观题智能阅卷技术的发展。因此,本课题基于上述研究,设计改进文本相似度计算方法,将其应用到主观题智能阅卷中,以提高主观题阅卷的准确率。本文主要研究内容:(1)针对依存关系和同义词词林在文本相似度中的应用,设计了一种基于依存关系与同义词词林相结合的语义相似度计算方法。该方法通过依存关系分别提取两个文本的关系路径,同时基于同义词词林计算两个文本之间关系路径的语义相似度。结合关系路径和同义词词林计算两个文本之间的语义相似度。实验结果表明,该算法提高了文本相似度计算的准确率。(2)设计了一种基于长短时记忆网络的文本相似度计算方法,并在实验训练过程中增加EarlyStopping机制,避免了过拟合、不收敛等问题。实验表明,该相似度计算方法在主观智能阅卷中也有较好的表现。(3)设计了基于上述算法的主观题智能评分模型,并运用某高中历史学科的月考试卷,对其中的大段主观题答案进行测试,实验表明,算法对主观题的智能评分和教师给分差异,可控制在一个相对合理的区间。综上,基于文本相似度的主观题智能阅卷技术可减轻教师工作量,提高教学效率,同时,可以提高主观题智能阅卷的精确度。