收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计模式识别的发音错误检测研究

魏思  
【摘要】: 随着语音识别技术的进展,计算机辅助语言学习系统的日趋智能化。为了提升计算机辅助语言学习系统的性能,其中一项核心技术就是高性能的发音错误检测技术。基于发音错误检测技术,系统可以生成针对性的改进意见以及设计相应的训练语料来有效改进学习者的发音弱点,提高学习效率。本文在统计模式识别技术特别是统计语音识别技术的基础上,对发音错误的分布、形成及表现都进行了深入而细致的分析,并在分析的基础上开展了声学特征、声学模型、检错算法、以及声学模型空间等方面的深入研究,最终在实现了对发音错误检测问题本质的深入认识的同时,研发成功了高性能的普通话发音错误检测技术。本论文的具体研究工作和研究成果概述如下: 首先,本论文在统计语音识别技术的基础上,对自动发音错误检测技术进行了改进。主要包括在声学特征方面引入CMN、VTLN等各种技术,解决声学模型和学习者声学特征之间的不匹配问题:同时,针对声学模型建模,引入语音识别中的基于BIC的模型压缩策略,首次提出并实现基于发音错误检测的BIC策略,此策略通过为发音错误严重或声学模型混淆严重的音素分配更多的参数来获得更好的建模精度从而提升检错系统性能;然后,针对声学模型与学习者的不匹配问题,引入语音识别领域中的较为成熟的自适应技术——MLLR——对模型均值进行了调整,大大降低了发音错误检错声学模型与学习者之间的不匹配,从而提升了检错系统的性能;接着,本文借鉴并改进了初始的后验概率策略,提出基于发音错误混淆列表的修正的后验概率策略来进行发音错误检测;最后,本文提出按照音素设置音素独立检错门限,取得了较好的检错性能。 其次,本文提出以错误发音先验概率(Text-dependent Mispronunciation PriorProbability,TMPP)作为依托,重新形式化后验概率的表达形式,从而无缝地把发音错误先验概率这一信息融合到了后验概率的计算当中,这就是文本相关正确发音的后验概率策略(Text-dependent Correct Pronunciation Posterior Probability,TCPP)。同时,为了解决错误发音先验概率的0概率问题,借鉴语言模型训练方法,对0概率事件采取平滑操作。实验结果表明,TCPP策略能够达到甚至超过启发式的运用错误发音特性的检错策略,并且给出了一种利用发音错误先验概率的普适、有效的方法,同时这种策略能够弥补启发式方法的一些天然缺陷。因此基于TCPP的检错策略是在后验概率框架下的一种较好的发音错误解决方案。 再次,本文通过调研语音识别中的置信度判别发现在置信度判别中通常有三种策略,后验概率只是其中的一种方法。还有一大类的方法是利用语音识别器得到的一些属性作为置信度判别的输入属性,建立分类器进行置信度判别。近年来的说话人识别研究表明,采用区分性的分类方法来解决检验问题是较好的策略。说话人识别中得到广泛运用的SVM区分性分类方法取得了很好的效果。本文从理论上分析了发音错误检测的特性,并指出后验概率对于发音错误检测的局限性,提出运用识别器输出的针对文本与模型空间内其它模型的似然比作为检错特征,从分类的角度来看到发音错误检测问题,引入SVM进行区分性分类器训练,从而有效地运用了人工标注数据信息以及识别器内的细节信息,最终有效的提升了发音错误检测性能。 然后,本文从发音错误检测的角度出发,分析了以音素为单元的声学模型对发音错误检测的不足之处:这种声学模型仅能较好的处理某音素明确的发音错误成了另一音素,而对于发音偏误但没有明确的错误成另一个音素或者是发音缺陷这些问题并不能很好的处理。本文指出必须要对发音错误和正确的各种情况进行针对性的建模,然后利用这些模型进行错误检测才能够处理变化多端的发音错误。本文利用大量发音者实际数据(包括发音标准正确,发音有方言口音,发音口音严重等各种情况)通过无监督的方法进行数据聚类获得各种发音的数据,然后进行模型训练建立三套发音模型,分别针对发音标准正确,发音正常稍有口音,和发音口音严重这几种情况,然后利用上面提及的SVM分类方法进行发音错误检测,与传统的仅使用音素模型相比,实现了发音错误检测性能的显著提升。 最后,本文针对调型进行了较深入的分析,针对不同人调域变化,提出最大似然基频均值规整方法:针对基频求取中出现的半频和倍频现象,利用最大似然特征选择策略进行规整。实验结果表明,采用了特征规整算法以后,调型发音错误检测取得了明显的性能提升。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴延年;梁维谦;;英语发音自动评测中单词删除错误的检测方法[J];电声技术;2009年11期
2 张锋;陈一宁;罗全锋;;语音识别在英语发音纠错中的应用[J];计算机应用与软件;2011年02期
3 赵博;檀晓红;;基于语音识别技术的英语口语教学系统[J];计算机应用;2009年03期
4 丁晓飞;胡国平;戴礼荣;;英语句子朗读发音中的音素自动检错系统[J];计算机应用与软件;2009年09期
5 吴静;;解密Super Star[J];办公自动化;2008年19期
6 龚澍;魏思;胡国平;刘庆峰;;普通话发音检错系统中TANDEM方法的研究与实现[J];计算机应用与软件;2011年07期
7 韩纪庆,王欢良,李海峰,郑铁然;基于语音识别的发音学习技术[J];电声技术;2004年09期
8 杜小梅,徐金娥;走出语音教学的误区,提高语音课教学质量[J];河北软件职业技术学院学报;2005年03期
9 刘庆升;魏思;胡郁;郭武;王仁华;;基于语言学知识的发音质量评价算法改进[J];中文信息学报;2007年04期
10 王孟杰;孟子厚;;基于参数距离的汉语普通话韵母决策树[J];电声技术;2010年03期
11 钱寿初;对王曙明“求疵”的答复[J];编辑学报;2000年03期
12 陈曦;;谁主持谁[J];青年记者;2006年05期
13 汤霖;黄建中;尹俊勋;;普通话声母的客观评测[J];计算机应用;2010年04期
14 张静;充分发挥语音室的作用[J];安徽教育;1996年11期
15 孟伟;关于我馆开展日语晚会活动的思考[J];图书馆工作与研究;1998年02期
16 汪翠珍;如何创建学生语音档案[J];上海铁道大学学报;1999年07期
17 郭晓敏,刘钰;电教媒体在职业技术学校中的应用[J];内蒙古电大学刊;2001年01期
18 王孟杰;孟子厚;;基于区别特征检测的汉语韵母分类[J];电声技术;2011年09期
19 李长安;步步高复读机学外语更容易[J];大众用电;2000年08期
20 黄骁勇;虞维平;;语音识别技术在外语口语学习中的应用[J];计算机系统应用;2006年06期
中国重要会议论文全文数据库 前10条
1 张茹;韩纪庆;;基于DTW算法的自动发音错误检测[A];第八届全国人机语音通讯学术会议论文集[C];2005年
2 鞠英;杜华;杨桂兰;;注射用更昔洛韦引发椎体外系反应1例[A];中华医学会第14次全国皮肤性病学术年会论文汇编[C];2008年
3 刘明辉;黄中伟;;基于GMM和VOT的音素发音错误检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 郭婕;;汉语语言迁移对英语学习的负面影响[A];河南省学校管理与学校心理研究会第十次学术研讨会论文集[C];2006年
5 黄雪梅;;如何培养幼儿全面发展[A];全国教育科研“十五”成果论文集(第五卷)[C];2005年
6 魏思;刘庆升;胡郁;王仁华;;带方言口音普通话自动水平测试[A];第八届全国人机语音通讯学术会议论文集[C];2005年
7 施星辉;邢树忠;陈宁;陶震江;刘杰;;颞肌瓣修复上颌骨及腭部缺损的语音功能评价[A];2004年中国口腔颌面修复重建外科学术会议论文汇编[C];2004年
8 黄秀芳;贺琳;吕士楠;;言语合成语料库发音人的挑选[A];第八届全国人机语音通讯学术会议论文集[C];2005年
9 李爱军;王霞;殷治纲;;汉语普通话和地方普通话的对比研究[A];第六届全国现代语音学学术会议论文集(上)[C];2003年
10 屠国平;;制定“PSC评分细则”的原则与方法[A];首届全国普通话水平测试学术研讨会论文集[C];2002年
中国博士学位论文全文数据库 前2条
1 张茹;汉语普通话发音自动评测方法的研究[D];哈尔滨工业大学;2013年
2 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 李红波;兰州方言区小学生英语发音错误分析[D];西北师范大学;2004年
2 景亮亮;山西运城方言区大学生英语音段音位发音错误及纠正措施[D];中北大学;2011年
3 蒙昌配;苗族学生英语辅音发音错误的优选论解释[D];贵州师范大学;2009年
4 徐慧;普通话鼻韵母区别特征参数分析[D];中国传媒大学;2009年
5 孙望;语音识别技术的研究及其在发音错误识别系统中的应用[D];南京航空航天大学;2008年
6 张琰彬;连续汉语普通话声调错误检测[D];北京交通大学;2007年
7 白嘉恩;上海本地青年人对于鼻尾音的发音与感知[D];上海外国语大学;2009年
8 杨晶;中国大学生英语词尾摩擦音的发音特征个案研究[D];延边大学;2013年
9 大西耕司;日本人的汉语拼音拼写错误问题研究[D];华东师范大学;2006年
10 孙丹;SLA口语问题与语言障碍对比研究[D];哈尔滨理工大学;2007年
中国重要报纸全文数据库 前10条
1 ;儿童发音异常早发现[N];中国中医药报;2006年
2 海童;孩子因何说话不清[N];中国中医药报;2006年
3 山东省垦利实验中学 王艳芳;我来讲课文[N];学知报;2011年
4 郭易楠 戴丽昕;打造中国极速之网[N];上海科技报;2006年
5 浙江慈溪锦堂学院 任央君;也谈普通话水平测评的差异性[N];语言文字周报;2007年
6 金彧;英语学习新时尚[N];中国电脑教育报;2002年
7 L&H公司高级副总裁及亚太区总裁 胡国辉博士;自然语言技术支持新一代语音上网[N];中国计算机报;2000年
8 王婷婷 王冬冬;时代呼唤高品位的主持明星[N];中华新闻报;2004年
9 记者 郑黎;发音要查清记牢靠 记音要记少不记多[N];长春日报;2006年
10 山东潍坊市潍城区庄头小学 刘金萍;“个性”的外语教学害了他们[N];中国教育报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978