收藏本站
《中国科学技术大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计模式识别的发音错误检测研究

魏思  
【摘要】: 随着语音识别技术的进展,计算机辅助语言学习系统的日趋智能化。为了提升计算机辅助语言学习系统的性能,其中一项核心技术就是高性能的发音错误检测技术。基于发音错误检测技术,系统可以生成针对性的改进意见以及设计相应的训练语料来有效改进学习者的发音弱点,提高学习效率。本文在统计模式识别技术特别是统计语音识别技术的基础上,对发音错误的分布、形成及表现都进行了深入而细致的分析,并在分析的基础上开展了声学特征、声学模型、检错算法、以及声学模型空间等方面的深入研究,最终在实现了对发音错误检测问题本质的深入认识的同时,研发成功了高性能的普通话发音错误检测技术。本论文的具体研究工作和研究成果概述如下: 首先,本论文在统计语音识别技术的基础上,对自动发音错误检测技术进行了改进。主要包括在声学特征方面引入CMN、VTLN等各种技术,解决声学模型和学习者声学特征之间的不匹配问题:同时,针对声学模型建模,引入语音识别中的基于BIC的模型压缩策略,首次提出并实现基于发音错误检测的BIC策略,此策略通过为发音错误严重或声学模型混淆严重的音素分配更多的参数来获得更好的建模精度从而提升检错系统性能;然后,针对声学模型与学习者的不匹配问题,引入语音识别领域中的较为成熟的自适应技术——MLLR——对模型均值进行了调整,大大降低了发音错误检错声学模型与学习者之间的不匹配,从而提升了检错系统的性能;接着,本文借鉴并改进了初始的后验概率策略,提出基于发音错误混淆列表的修正的后验概率策略来进行发音错误检测;最后,本文提出按照音素设置音素独立检错门限,取得了较好的检错性能。 其次,本文提出以错误发音先验概率(Text-dependent Mispronunciation PriorProbability,TMPP)作为依托,重新形式化后验概率的表达形式,从而无缝地把发音错误先验概率这一信息融合到了后验概率的计算当中,这就是文本相关正确发音的后验概率策略(Text-dependent Correct Pronunciation Posterior Probability,TCPP)。同时,为了解决错误发音先验概率的0概率问题,借鉴语言模型训练方法,对0概率事件采取平滑操作。实验结果表明,TCPP策略能够达到甚至超过启发式的运用错误发音特性的检错策略,并且给出了一种利用发音错误先验概率的普适、有效的方法,同时这种策略能够弥补启发式方法的一些天然缺陷。因此基于TCPP的检错策略是在后验概率框架下的一种较好的发音错误解决方案。 再次,本文通过调研语音识别中的置信度判别发现在置信度判别中通常有三种策略,后验概率只是其中的一种方法。还有一大类的方法是利用语音识别器得到的一些属性作为置信度判别的输入属性,建立分类器进行置信度判别。近年来的说话人识别研究表明,采用区分性的分类方法来解决检验问题是较好的策略。说话人识别中得到广泛运用的SVM区分性分类方法取得了很好的效果。本文从理论上分析了发音错误检测的特性,并指出后验概率对于发音错误检测的局限性,提出运用识别器输出的针对文本与模型空间内其它模型的似然比作为检错特征,从分类的角度来看到发音错误检测问题,引入SVM进行区分性分类器训练,从而有效地运用了人工标注数据信息以及识别器内的细节信息,最终有效的提升了发音错误检测性能。 然后,本文从发音错误检测的角度出发,分析了以音素为单元的声学模型对发音错误检测的不足之处:这种声学模型仅能较好的处理某音素明确的发音错误成了另一音素,而对于发音偏误但没有明确的错误成另一个音素或者是发音缺陷这些问题并不能很好的处理。本文指出必须要对发音错误和正确的各种情况进行针对性的建模,然后利用这些模型进行错误检测才能够处理变化多端的发音错误。本文利用大量发音者实际数据(包括发音标准正确,发音有方言口音,发音口音严重等各种情况)通过无监督的方法进行数据聚类获得各种发音的数据,然后进行模型训练建立三套发音模型,分别针对发音标准正确,发音正常稍有口音,和发音口音严重这几种情况,然后利用上面提及的SVM分类方法进行发音错误检测,与传统的仅使用音素模型相比,实现了发音错误检测性能的显著提升。 最后,本文针对调型进行了较深入的分析,针对不同人调域变化,提出最大似然基频均值规整方法:针对基频求取中出现的半频和倍频现象,利用最大似然特征选择策略进行规整。实验结果表明,采用了特征规整算法以后,调型发音错误检测取得了明显的性能提升。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TN912.34

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 龚澍;魏思;胡国平;刘庆峰;;普通话发音检错系统中TANDEM方法的研究与实现[J];计算机应用与软件;2011年07期
2 齐欣;肖云鹏;叶卫平;;普通话发音评估性能改进[J];中文信息学报;2013年03期
中国博士学位论文全文数据库 前2条
1 严可;发音质量自动评测技术研究[D];中国科学技术大学;2012年
2 周小平;错误识别理论与方法及其在裁判员决策支持系统中的应用[D];广东工业大学;2013年
中国硕士学位论文全文数据库 前3条
1 孟平;发音自动评估系统的设计与实现[D];武汉理工大学;2010年
2 沈彩凤;汉语普通话声调评测算法研究[D];苏州大学;2012年
3 闫建鹏;基于多模态特征的新闻视频语义分析[D];西安电子科技大学;2012年
【参考文献】
中国期刊全文数据库 前1条
1 魏思;刘庆升;胡郁;王仁华;;普通话水平测试电子化系统[J];中文信息学报;2006年06期
【共引文献】
中国期刊全文数据库 前10条
1 申向阳;试论普通话测试中心理因素的负效应及调控策略[J];阿坝师范高等专科学校学报;2005年01期
2 卓如;;关于轻声的探析[J];安徽电子信息职业技术学院学报;2007年06期
3 曹芝兵;;影响普通话水平测试的模糊性因素及对策研究[J];安徽文学(下半月);2008年07期
4 岳秀文;;“教师口语”课程应当实施分类教学[J];安庆师范学院学报(社会科学版);2009年12期
5 胡钢,沈文轩;一种基于噪声动态检测的语音端点检测算法[J];鞍山科技大学学报;2004年02期
6 胡钢;;一种语音端点检测算法在DSP上的实现[J];鞍山师范学院学报;2009年06期
7 李清瑛;吴守雷;;PSC朗读的情感需要[J];白城师范学院学报;2006年02期
8 王如辰;隋英华;;高师大学语文课程教育价值实现的路径探析[J];白城师范学院学报;2010年01期
9 关彦庆;;《普通话水平测试实施纲要》测试用朗读作品指瑕[J];北华大学学报(社会科学版);2006年04期
10 王玲玲;;中介语理论与普通话测试——“目标参照”在普通话测试中的运用[J];北华大学学报(社会科学版);2007年06期
中国博士学位论文全文数据库 前10条
1 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
2 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
3 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
4 沈世玘;北京话单音节异读词社会分层研究[D];中央民族大学;2011年
5 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
6 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
7 张翔;小型五轴联动机床介观尺寸铣削加工及其相关模型的研究[D];哈尔滨工业大学;2011年
8 吕晓玲;基于听觉信息的机器人声源定位技术研究[D];河北工业大学;2010年
9 杜金榜;基于语音编码的旋转机械振动数据压缩关键技术与系统研究[D];国防科学技术大学;2011年
10 付强;语音的参数表示和质量客观评价研究[D];西安电子科技大学;2000年
中国硕士学位论文全文数据库 前10条
1 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
2 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
3 杨文强;基于AMBE-2000的OFDM水声语音通信平台研究[D];哈尔滨工程大学;2010年
4 邬鑫锋;基于短时谱估计的语音增强研究[D];湘潭大学;2010年
5 郭秋雨;小词汇量非特定人的孤立词语音识别系统研究[D];中国海洋大学;2010年
6 单进;基于压缩感知的鲁棒性说话人识别[D];苏州大学;2010年
7 吴荣娣;基于特征分类直方图均衡的鲁棒性语音识别研究[D];苏州大学;2010年
8 童佳宁;基于HMM和PNN的混合语音识别模型研究[D];河北工程大学;2010年
9 杨成;嵌入式平台语音识别系统及优化研究[D];华南理工大学;2010年
10 姜海鹏;基于矢量量化的音频信号辨析系统的研究[D];哈尔滨理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 杨春怀,刘贵宝;自由式滑雪空中技巧比赛场地标准化电子裁判系统的研究与设计[J];冰雪运动;2004年02期
2 李雪龙;封化民;刘飚;焦黎冰;;一种改进的视频标题检测与提取方法[J];江西师范大学学报(自然科学版);2008年02期
3 史桂红;一种基于对象状态的软件测试方法[J];电脑与信息技术;2005年02期
4 刘佳;尹治本;;基于对象状态的面向对象软件测试方法研究[J];电脑知识与技术;2008年35期
5 吕蓬飞;;基于情感标注的自动编舞系统[J];电子技术;2008年08期
6 林铭德;戴一璟;刘莞;;建筑安装工程图纸对象自动识别方法的研究[J];电子技术应用;2011年09期
7 李红莲,袁保宗,王春花;利用背景知识提高web语音浏览中的识别精度的方法[J];电子学报;2002年12期
8 覃鸿,王守觉;多权值神经元网络仿生模式识别方法在低训练样本数量非特定人语音识别中与HMM及DTW的比较研究[J];电子学报;2005年05期
9 孙显;付琨;王宏琦;;基于分等级对象语义图模型的复杂目标自动识别方法研究[J];电子与信息学报;2011年05期
10 李敏;郭开仲;;模糊错误集的相关运算及其应用[J];广东工业大学学报;2007年01期
中国博士学位论文全文数据库 前10条
1 付强;语音的参数表示和质量客观评价研究[D];西安电子科技大学;2000年
2 吴义坚;基于隐马尔科夫模型的语音合成技术研究[D];中国科学技术大学;2006年
3 李超雷;交互式语言学习系统中的发音质量客观评价方法研究[D];中国科学院研究生院(电子学研究所);2007年
4 鄢志杰;声学模型区分性训练及其在自动语音识别中的应用[D];中国科学技术大学;2008年
5 张峰;基于统计模式识别发音错误自动检测的研究[D];中国科学技术大学;2009年
6 刘新妹;基于指纹识别的规则纹理图像识别技术研究[D];中北大学;2008年
7 赵衍运;图像对象特征提取与识别[D];北京邮电大学;2009年
8 刘庆升;计算机辅助普通话发音评测关键技术研究[D];中国科学技术大学;2010年
9 胡智慧;汉字智能工具中的书写错误识别技术研究与应用[D];中国科学技术大学;2010年
10 文学志;基于机器学习的路面对象识别关键技术研究[D];东北大学;2008年
中国硕士学位论文全文数据库 前10条
1 江超;视频语义提取分析研究[D];西安电子科技大学;2011年
2 刘峰;计算机辅助语言学习模式的构建及应用[D];吉林大学;2006年
3 苏鹏飞;英语口语评估算法研究[D];哈尔滨工业大学;2006年
4 武琳;言语交际中语境的动态建构及其对英语课堂教学的启示[D];吉林大学;2007年
5 张琰彬;连续汉语普通话声调错误检测[D];北京交通大学;2007年
6 任蕊;基于Fujisaki模型的情感语音信号分析与合成[D];北京交通大学;2008年
7 王艳;基于主题字幕提取的新闻视频检索研究[D];南京理工大学;2008年
8 孙菲;计算机辅助教学环境下的英语口语学习策略研究[D];山东大学;2008年
9 赵博;语音识别应用于计算机辅助语言学习的研究[D];上海交通大学;2009年
10 严可;英文朗读题及复述题自动评测技术研究[D];中国科学技术大学;2009年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 沈彩凤;汉语普通话声调评测算法研究[D];苏州大学;2012年
【二级参考文献】
中国期刊全文数据库 前1条
1 郭巧,陆际联;计算机辅助汉语教学系统中语音评价体系初探[J];中文信息学报;1999年03期
【相似文献】
中国期刊全文数据库 前10条
1 吴延年;梁维谦;;英语发音自动评测中单词删除错误的检测方法[J];电声技术;2009年11期
2 张锋;陈一宁;罗全锋;;语音识别在英语发音纠错中的应用[J];计算机应用与软件;2011年02期
3 赵博;檀晓红;;基于语音识别技术的英语口语教学系统[J];计算机应用;2009年03期
4 丁晓飞;胡国平;戴礼荣;;英语句子朗读发音中的音素自动检错系统[J];计算机应用与软件;2009年09期
5 吴静;;解密Super Star[J];办公自动化;2008年19期
6 龚澍;魏思;胡国平;刘庆峰;;普通话发音检错系统中TANDEM方法的研究与实现[J];计算机应用与软件;2011年07期
7 韩纪庆,王欢良,李海峰,郑铁然;基于语音识别的发音学习技术[J];电声技术;2004年09期
8 杜小梅,徐金娥;走出语音教学的误区,提高语音课教学质量[J];河北软件职业技术学院学报;2005年03期
9 刘庆升;魏思;胡郁;郭武;王仁华;;基于语言学知识的发音质量评价算法改进[J];中文信息学报;2007年04期
10 王孟杰;孟子厚;;基于参数距离的汉语普通话韵母决策树[J];电声技术;2010年03期
中国重要会议论文全文数据库 前10条
1 张茹;韩纪庆;;基于DTW算法的自动发音错误检测[A];第八届全国人机语音通讯学术会议论文集[C];2005年
2 鞠英;杜华;杨桂兰;;注射用更昔洛韦引发椎体外系反应1例[A];中华医学会第14次全国皮肤性病学术年会论文汇编[C];2008年
3 刘明辉;黄中伟;;基于GMM和VOT的音素发音错误检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 郭婕;;汉语语言迁移对英语学习的负面影响[A];河南省学校管理与学校心理研究会第十次学术研讨会论文集[C];2006年
5 黄雪梅;;如何培养幼儿全面发展[A];全国教育科研“十五”成果论文集(第五卷)[C];2005年
6 魏思;刘庆升;胡郁;王仁华;;带方言口音普通话自动水平测试[A];第八届全国人机语音通讯学术会议论文集[C];2005年
7 施星辉;邢树忠;陈宁;陶震江;刘杰;;颞肌瓣修复上颌骨及腭部缺损的语音功能评价[A];2004年中国口腔颌面修复重建外科学术会议论文汇编[C];2004年
8 黄秀芳;贺琳;吕士楠;;言语合成语料库发音人的挑选[A];第八届全国人机语音通讯学术会议论文集[C];2005年
9 李爱军;王霞;殷治纲;;汉语普通话和地方普通话的对比研究[A];第六届全国现代语音学学术会议论文集(上)[C];2003年
10 屠国平;;制定“PSC评分细则”的原则与方法[A];首届全国普通话水平测试学术研讨会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 ;儿童发音异常早发现[N];中国中医药报;2006年
2 海童;孩子因何说话不清[N];中国中医药报;2006年
3 山东省垦利实验中学 王艳芳;我来讲课文[N];学知报;2011年
4 郭易楠 戴丽昕;打造中国极速之网[N];上海科技报;2006年
5 浙江慈溪锦堂学院 任央君;也谈普通话水平测评的差异性[N];语言文字周报;2007年
6 金彧;英语学习新时尚[N];中国电脑教育报;2002年
7 L&H公司高级副总裁及亚太区总裁 胡国辉博士;自然语言技术支持新一代语音上网[N];中国计算机报;2000年
8 王婷婷 王冬冬;时代呼唤高品位的主持明星[N];中华新闻报;2004年
9 记者 郑黎;发音要查清记牢靠 记音要记少不记多[N];长春日报;2006年
10 山东潍坊市潍城区庄头小学 刘金萍;“个性”的外语教学害了他们[N];中国教育报;2010年
中国博士学位论文全文数据库 前2条
1 张茹;汉语普通话发音自动评测方法的研究[D];哈尔滨工业大学;2013年
2 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 李红波;兰州方言区小学生英语发音错误分析[D];西北师范大学;2004年
2 景亮亮;山西运城方言区大学生英语音段音位发音错误及纠正措施[D];中北大学;2011年
3 蒙昌配;苗族学生英语辅音发音错误的优选论解释[D];贵州师范大学;2009年
4 徐慧;普通话鼻韵母区别特征参数分析[D];中国传媒大学;2009年
5 孙望;语音识别技术的研究及其在发音错误识别系统中的应用[D];南京航空航天大学;2008年
6 张琰彬;连续汉语普通话声调错误检测[D];北京交通大学;2007年
7 白嘉恩;上海本地青年人对于鼻尾音的发音与感知[D];上海外国语大学;2009年
8 杨晶;中国大学生英语词尾摩擦音的发音特征个案研究[D];延边大学;2013年
9 大西耕司;日本人的汉语拼音拼写错误问题研究[D];华东师范大学;2006年
10 孙丹;SLA口语问题与语言障碍对比研究[D];哈尔滨理工大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026