收藏本站
《中国科学技术大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

计算机辅助普通话发音评测关键技术研究

刘庆升  
【摘要】: 语言是人类沟通最便捷的手段,随着社会的发展,计算机辅助语言学习越来越受到人们重视。计算机辅助语言学习系统中的核心技术之一就是高性能的发音评测技术。发音评测技术可以使学习者随时了解自己的发音水平和发音能力,从而更有针对性的学习和朝着正确的方向进行训练。本文在基于统计语音识别的发音评测技术基础上,对发音评测的核心算法,发音评测声学模型的自适应方法,时长、语速在发音评测中的应用,以及发音评测系统中的打分映射模型等方面进行了研究。本文的研究成果在普通话发音评测方面经过验证基本达到了实用水平。本论文的具体研究工作和成果概述如下: 首先,本文在介绍发音评测系统主要研究内容和研究方向的基础上,对发音评测的核心算法——对数后验概率算法进行了深入分析,并提出了包括:根据语音学知识改进发音评测中的识别网络来简化对数后验概率算式;基于模型间距离差来生成发音错误模式的思想,并以KLD差来计算模型间距离差,再以错误模式来构建发音评测的识别网络以简化对数后验概率算式;基于普通话水平测试中的重点音与难点音的带音素权重因子的后验概率规整算法等三种改进算法。这些改进,在针对普通话的发音评测基线系统上都取得了较好的性能提升。 接着,本文针对发音评测中使用的语音模型的应用环境和训练环境的不匹配问题,仔细分析了发音评测与语音识别对声学模型的不同需求。指出,虽然发音评测与语音识别有诸多的相似,但两者在目的上截然不同,语音识别是要将不同人、不同时间下千差万别的同一个字的发音“模糊”识别为同一个文字,而发音评测是要“精细”分辨出这千差万别的发音的标准程度。最终,从语音识别中的模型自适应出发,提出了选择性自适应的策略,用以选择出发音人发音数据中的相对标准数据对发音评测系统所用的声学模型进行自适应,并分析了选择数据的量和数据选择的粒度对自适应效果的影响。 然后,本文研究了时长和语速在发音评测上的应用。调研了早期关于语速的研究及其在语音合成和发音评测中的应用,重点介绍了绝对语速和基于ANGIE的时长模型,并运用ANGIE的时长模型实现了普通话发音评测的时长归一化和相对语速计算。文中还介绍了绝对语速、相对语速等时长模型计算时长得分的方法,并实验对比了几种时长得分的性能。 最后,本文从构建一个实用的普通话发音评测系统出发,研究了发音评测系统中用于将评测测度转换为机器预测分数的打分映射模型。在介绍了通用的多元线性回归映射模型的算法和分析其在实际应用中的不足后,文中采用分段线性回归模犁对通用映射模型进行优化,并详细介绍了基于置信区间分段线性回归、GMM概率加权线性回归以及SVM分类分段线性回归等三种的分段线性回归模型算法。同时,实验对比了三种模型的性能。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TN912.34

手机知网App
【引证文献】
中国期刊全文数据库 前4条
1 严可;魏思;戴礼荣;;针对发音质量评测的声学模型优化算法[J];中文信息学报;2013年01期
2 严可;魏思;戴礼荣;刘庆峰;;基于音素相关后验概率变换的发音质量评价[J];清华大学学报(自然科学版);2011年09期
3 郭凌燕;;普通话教学培训测试的科学体系构建[J];学周刊;2012年16期
4 梁迎丽;梁英豪;;基于语音评测的英语口语智能导师系统研究[J];现代教育技术;2012年11期
中国博士学位论文全文数据库 前1条
1 严可;发音质量自动评测技术研究[D];中国科学技术大学;2012年
【参考文献】
中国期刊全文数据库 前7条
1 韩纪庆,王欢良,李海峰,郑铁然;基于语音识别的发音学习技术[J];电声技术;2004年09期
2 黄双;李婧;王洪莹;杨军;张波;;基于发音易混淆模型的发音质量评价算法[J];计算机应用;2006年S2期
3 魏思;刘庆升;胡郁;王仁华;;普通话水平测试电子化系统[J];中文信息学报;2006年06期
4 刘庆升;魏思;胡郁;郭武;王仁华;;基于语言学知识的发音质量评价算法改进[J];中文信息学报;2007年04期
5 郭巧,陆际联;计算机辅助汉语教学系统中语音评价体系初探[J];中文信息学报;1999年03期
6 梁维谦,王国梁,刘加,刘润生;基于音素的发音质量评价算法[J];清华大学学报(自然科学版);2005年01期
7 刘庆升;魏思;胡郁;王仁华;;基于KLD差的统计错误模式生成算法[J];数据采集与处理;2009年01期
【共引文献】
中国期刊全文数据库 前10条
1 胡钢,沈文轩;一种基于噪声动态检测的语音端点检测算法[J];鞍山科技大学学报;2004年02期
2 胡钢;;一种语音端点检测算法在DSP上的实现[J];鞍山师范学院学报;2009年06期
3 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
4 邓勇,施文康;基于TMS320C50的语音频谱分析仪[J];兵工自动化;2000年03期
5 王继祥;刘贵忠;刘广健;高向东;;基于小波谱失真测度的语音质量评估[J];兵工学报;2008年01期
6 徐俊晓,谢锋,江建平,莫运明,郑中华;我国12种无尾类的鸣叫特征参数[J];动物学杂志;2005年03期
7 冯成林,吴淑珍;一种噪声环境下的语音识别方法(线性预测误差法)的研究[J];北京大学学报(自然科学版);2000年05期
8 黄新宇,吴淑珍;基于单边自相关线性预测噪声中汉语语音识别[J];北京大学学报(自然科学版);2000年05期
9 刘敬伟,程乾生;基于动态时间规划的基因芯片数据识别[J];北京大学学报(自然科学版);2002年05期
10 段新,黄新宇,吴淑珍;与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J];北京大学学报(自然科学版);2003年05期
中国重要会议论文全文数据库 前10条
1 严可;魏思;戴礼荣;刘庆峰;;基于音素相关后验概率变换的发音质量评价[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
2 张珑;李海峰;马琳;;利用移动设备辅助汉语普通话发音学习研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 严可;魏思;戴礼荣;刘庆峰;;基于音素相关后验概率变换的发音质量评价[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
4 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
5 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
6 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
7 牟峰;俞铁城;杨道淳;;新型半波语音编解码的实现[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 邹绘华;李双田;;基于频谱斜率约束的变速率语音编码算法研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 李灿伟;杨震;;基于DCT的有色噪声消除算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
10 周珺;范京;刘惠华;;汉语语音音量和语速变化的自适应的调整[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
3 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
4 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
5 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
6 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
7 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
8 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
9 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
10 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
4 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
5 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
6 楼佳;基于网络QoS的AMR语音编码算法研究[D];哈尔滨工程大学;2010年
7 杨文强;基于AMBE-2000的OFDM水声语音通信平台研究[D];哈尔滨工程大学;2010年
8 周翠梅;说话人识别技术的研究与实现[D];大连理工大学;2010年
9 邬鑫锋;基于短时谱估计的语音增强研究[D];湘潭大学;2010年
10 庞敏辉;语音库自动构建技术的研究[D];中国海洋大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 祁均;梁维谦;;区分性训练算法在英语语音评测中的应用[J];电声技术;2011年08期
2 黄双;李婧;王洪莹;杨军;张波;;基于发音易混淆模型的发音质量评价算法[J];计算机应用;2006年S2期
3 严可;胡国平;魏思;李萌涛;杨晓果;冯国栋;;计算机用于英语背诵题的自动评分技术初探[J];计算机应用与软件;2010年07期
4 魏思;刘庆升;胡郁;王仁华;;普通话水平测试电子化系统[J];中文信息学报;2006年06期
5 刘庆升;魏思;胡郁;郭武;王仁华;;基于语言学知识的发音质量评价算法改进[J];中文信息学报;2007年04期
6 严可;戴礼荣;;基于音素评分模型的发音标准度评测研究[J];中文信息学报;2011年05期
7 郭巧,陆际联;计算机辅助汉语教学系统中语音评价体系初探[J];中文信息学报;1999年03期
8 张兰;;畅言语音教具系统在英语课堂上的应用[J];中国现代教育装备;2011年12期
9 梁维谦,王国梁,刘加,刘润生;基于音素的发音质量评价算法[J];清华大学学报(自然科学版);2005年01期
10 严可;胡国平;魏思;戴礼荣;李萌涛;杨晓果;冯国栋;;面向大规模英语口语机考的复述题自动评分技术[J];清华大学学报(自然科学版);2009年S1期
中国重要报纸全文数据库 前1条
1 记者 朱振岳;[N];中国教育报;2009年
中国博士学位论文全文数据库 前5条
1 李超雷;交互式语言学习系统中的发音质量客观评价方法研究[D];中国科学院研究生院(电子学研究所);2007年
2 鄢志杰;声学模型区分性训练及其在自动语音识别中的应用[D];中国科学技术大学;2008年
3 魏思;基于统计模式识别的发音错误检测研究[D];中国科学技术大学;2008年
4 张峰;基于统计模式识别发音错误自动检测的研究[D];中国科学技术大学;2009年
5 傅灵;方言与普通话的接触研究[D];苏州大学;2010年
中国硕士学位论文全文数据库 前1条
1 龚澍;基于TANDEM的声学模型区分性训练在语音评测系统中的研究[D];中国科学技术大学;2010年
【二级引证文献】
中国期刊全文数据库 前2条
1 王玉林;郭帆;余敏;;英语口语自动评分系统中发音错误的研究[J];计算机应用与软件;2013年06期
2 汤霖;彭土有;尹俊勋;;基于预分类的声母客观评测方法[J];湖南科技大学学报(自然科学版);2012年01期
中国硕士学位论文全文数据库 前1条
1 王玉林;英语口语评分系统的研究与设计[D];江西师范大学;2013年
【二级参考文献】
中国期刊全文数据库 前9条
1 韩纪庆,王欢良,李海峰,郑铁然;基于语音识别的发音学习技术[J];电声技术;2004年09期
2 黄泽镇,杨行峻;用HLPC算法估计共振峰参数的精度研究[J];电子学报;1990年05期
3 刘振安,王晋军,孙捷;基于数字串内容识别的用户验证方法研究[J];测控技术;2005年09期
4 魏思;刘庆升;胡郁;王仁华;;普通话水平测试电子化系统[J];中文信息学报;2006年06期
5 郭巧,陆际联;计算机辅助汉语教学系统中语音评价体系初探[J];中文信息学报;1999年03期
6 乐眉云,凌德祥;汉语各方言区学生英语发音常误分析──汉英语音对比系列研究(之三)[J];外语研究;1994年03期
7 梁维谦,王国梁,刘加,刘润生;基于音素的发音质量评价算法[J];清华大学学报(自然科学版);2005年01期
8 贲俊,余小清,万旺根,DanielP.K.Lun;基于语音识别置信度的英语语言学习算法研究[J];上海大学学报(自然科学版);2002年05期
9 王兵,苏恩泽;汉语语音的时域声调转换方法[J];数据采集与处理;1996年01期
中国重要会议论文全文数据库 前2条
1 魏思;刘庆升;胡郁;王仁华;;带方言口音普通话自动水平测试[A];第八届全国人机语音通讯学术会议论文集[C];2005年
2 董滨;赵庆卫;颜永红;;发音质量自动评估的现有算法分析[A];第八届全国人机语音通讯学术会议论文集[C];2005年
【相似文献】
中国期刊全文数据库 前10条
1 黄中伟;杨磊;徐明;冯杉杉;;普通话语音识别中的基本音素分析[J];深圳大学学报(理工版);2006年04期
2 程庆祥;;语音识别电路简介[J];家电科技;1990年02期
3 张连海,韩华,王炳锡;过零周期转移概率矩阵语音识别方法的改进[J];信息工程学院学报;1994年01期
4 闫守华;语音控制系统的研制[J];成都气象学院学报;1997年03期
5 李晓霞,王东木,李雪耀;语音识别技术评述[J];计算机应用研究;1999年10期
6 李虎生,刘加,刘润生;利用多层感知机映射提高不匹配环境下的语音识别性能[J];电路与系统学报;1999年04期
7 陈海英,于金辉;利用语音识别进行信息检索[J];情报学报;2003年01期
8 刘占军;;我的Word更“听话”[J];电脑知识与技术(经验技巧);2010年10期
9 袁里驰;;基于改进的隐马尔科夫模型的语音识别方法[J];中南大学学报(自然科学版);2008年06期
10 赵显富;;译者的话[J];计算技术与自动化;1985年04期
中国重要会议论文全文数据库 前10条
1 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
2 余鹏;王作英;;语音识别码本状态间的线性和非线性相关性[A];第六届全国人机语音通讯学术会议论文集[C];2001年
3 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 靳慧龙;;基于DSP的电视语音拨号遥控技术[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
5 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
6 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 郭晨;;汉语语音技术[A];第一届学生计算语言学研讨会论文集[C];2002年
9 赵海滨;王宏;闻绍飞;;嵌入式语音识别控制机械手的系统设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
10 刘秉权;张凯;王晓龙;;语音识别中基于规则的语言模型的研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
中国重要报纸全文数据库 前10条
1 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
2 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
3 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
4 ;“超人类语音识别”计划[N];中国计算机报;2002年
5 ;Intel涉足语音识别[N];计算机世界;2003年
6 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
7 小雷;芝麻开门[N];电脑商报;2006年
8 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
9 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
10 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 刘庆升;计算机辅助普通话发音评测关键技术研究[D];中国科学技术大学;2010年
2 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
3 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
4 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
5 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
6 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
7 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
8 宁爱平;人工蜂群算法及其在语音识别中的应用研究[D];太原理工大学;2013年
9 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
10 陈伟;语音识别声学建模中的主动学习研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 王霅煜;基于VQ和ASR的多媒体课件检索[D];上海交通大学;2010年
2 郭恒飞;基于非特定人车载电器语音集成控制系统的设计与实现[D];合肥工业大学;2011年
3 王秋杰;TD-SCDMA网络测试软件中语音识别模块的设计与实现[D];北京邮电大学;2011年
4 彭峰;基于SALT的交互式语音应答系统——SALT技术的分析与应用[D];四川大学;2004年
5 江超;视频语义提取分析研究[D];西安电子科技大学;2011年
6 朱晗鸣;嵌入式小词汇量语音识别系统的设计与实现[D];大连理工大学;2005年
7 龙丽霞;基于实例语境的语音识别后文本检错与纠错研究[D];北京邮电大学;2010年
8 宋叔飚;神经网络在语音识别中的应用研究[D];西北工业大学;2002年
9 庞雄昌;语音识别及其定点DSP实现[D];西安电子科技大学;2004年
10 熊飞丽;语音识别技术在语言教学软件中的应用研究[D];国防科学技术大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026