英语口语学习中的语音识别技术
【摘要】:
随着计算机技术的发展,计算机辅助教学在教育领域运用越来越广泛。现在借助于计算机辅助教学人们已经可以更加便捷的学习语言。计算机丰富的图形、声音处理功能有力促进了人们的语言学习效果。目前该领域的研究热点集中在探索有效的语言学习方法,把语音识别技术与多媒体技术相结合。开发具有语音识别判别能力的教学软件,己成为这一类语言教学的热点。
虽然目前语言教学软件发展较快,但是众多软件都缺乏对口语学习结果良好的评估和反馈。然而在语言发音学习中,对学习者一个很大的帮助就是来自于有效的反馈。这就成为制约智能化学习软件发展的一大瓶劲。对于这一问题,本论文将首先介绍语音识别相关基础知识,根据中国人的英语发音习惯,研究建立针对性的语料库,结合以中文为母语的英语口语学习者的需求,利用基于HMM模型的语音识别技术,对语音进行Viterbi解码,并通过后验概率进行识别评分。最后运用专家库进行音素纠错,实现一个整合了解码、评分与纠错三大功能模块的系统。其中主要工作集中在深入研究语音识别基础上的语音评分和纠错算法,解决语音识别技术应用于口语学习的一系列应用上的难题,尤其是在语音纠错方面。最终为英语口语学习软件的开发提供一套可行的技术方案。
在该系统方案基础上,本论文介绍了各个模块的具体技术实现并提供了部分核心模块,核心函数的实现细节。最终经过试验测试,用实际数据论证该方案的可行性。
上述技术已在上海交通大学与Sharp株式会社合作项目“世博英语口语学习”项目中得到应用。