收藏本站
《中国科学技术大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计模式识别发音错误自动检测的研究

张峰  
【摘要】: 发音错误自动检测是计算机辅助语言学习系统的关键技术,在很大程度上决定了计算机辅助语言学习系统的性能。可靠的自动发音错误检测技术有助于计算机辅助语言学习系统了解学习者掌握语言的水平,分析出学习者的发音缺陷,针对性的给出改进意见,并给出对应的学习材料,有效的提高学习者的语言水平。本文针对主流的基于统计模式识别的发音错误自动检测技术进行了深入的分析,在声学模型和后端处理方面都进行了有针对性地研究,建立了性能稳定的发音检错系统。本论文的具体工作和研究成果概述如下。 首先,本文调研了发音错误自动检测技术,通过对该研究背景和现状的分析,选择了基于统计语音识别的策略作为发音错误检测的基本方法。在对基本的发音检错的系统进行介绍时,本文重点说明了系统中的错误检测度量得分算法。针对原有的错误检测度量得分算法在实际使用中的缺陷,本文提出了SLPP算法,其检错性能要明显好于原有算法。在对本文的实验数据库进行介绍时,分析了数据库上几个专家检错结果的一致性问题,了解了人工发音检错的性能,说明了发音检错自动任务的挑战性。 其次,在声学模型的改进方面,本文提出了引入统计语音识别中的自适应技术,将该技术用于测试数据,减少测试数据与训练数据的不匹配,同时也应用于训练数据,以有效的估计出话者无关的规范模型。在对测试数据采用自适应技术时,本文引入了语音识别中成熟的MLLR算法。由于语音检错与语音识别的目标不一致,MLLR算法不一定能提高发音检错系统的性能。为此,本文针对发音检错的目标,提出了SMLLR的自适应技术;在对训练数据采用自适应技术时,本文引入了语音识别中的SAT算法,以生成规范的声学模型,提高检错性能。由于规范模型会导致其与测试数据更加不一致,因此需要把SAT技术和SMLLR技术结合使用,以有效的提高发音检错系统的性能。 再次,在声学建模的改进方面,本文还提出了采用语音识别中的区分性训练的思想,针对性的设置与发音检错目标相一致的声学建模目标函数。通过回顾语音识别中的各种区分性训练的方法,本文说明了这些区分性训练的方法如何与语音识别的提高识别率的这个目标函数相一致。然后针对发音检错的任务,本文分析了该任务的目标函数以及与之对应的区分性训练的策略,提出了发音检错的区分性训练的方法要与错误检测度量得分算法相一致,并且提出在进行区分性训练时,训练数据库中除了正确发音的样本外,还需要错误发音的样本,否则区分性训练可能作用不明显。 此外,除了声学建模的改进以外,本文还从发音检错的后端处理方面,提出了三维后端归一化的处理策略和基于机器学习的后端处理策略。首先,通过对专家打分和实验数据的分析,提出了要在说话人层次上引入说话人整体发音水平的特征;其次,通过对文本相关的后验概率的分析,提出了要在说话内容层次上引入音素类别的特征;再次,通过对系统使用中的干扰问题的分析,提出了要在说话时间层次引入前后文得分的特征。最后,通过引入这三个层次的特征,提出了三维后端归一化的处理策略,大幅度提高了系统性能。三维后端归一化的处理策略也有一些问题,比如多维特征的处理。为了解决这些问题,我们提出了更加可靠的基于机器学习的后端处理策略,通过SVM来处理多维特征的优化。 最后,通过以上的研究工作,可以实现一个性能比较稳定的发音检错系统,在此基础上,本文提出了发音检错的声学模型自动更新策略,该策略能通过对未标注的原始数据的获得,针对错误发音样本进行处理,不断的提高发音检错系统的性能。首先,本文分析了错误检测度量生成算法,说明了对错误发音进行建模的必要性;接着通过对错误发音的特点和非监督的参数估计的分析,提出了几种错误发音建模的策略,其中错误发音半监督聚类建模的算法效果最好。进一步,通过已建立的性能比较可靠的检错系统以及错误发音建模算法,本文提出了发音检错的声学模型自动更新策略,能够处理未标注的原始数据,改进声学模型的建模空间,提高发音检错系统的性能。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP391.42

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 严可;魏思;戴礼荣;;针对发音质量评测的声学模型优化算法[J];中文信息学报;2013年01期
中国博士学位论文全文数据库 前1条
1 严可;发音质量自动评测技术研究[D];中国科学技术大学;2012年
【共引文献】
中国期刊全文数据库 前10条
1 申向阳;试论普通话测试中心理因素的负效应及调控策略[J];阿坝师范高等专科学校学报;2005年01期
2 卓如;;关于轻声的探析[J];安徽电子信息职业技术学院学报;2007年06期
3 曹芝兵;;影响普通话水平测试的模糊性因素及对策研究[J];安徽文学(下半月);2008年07期
4 岳秀文;;“教师口语”课程应当实施分类教学[J];安庆师范学院学报(社会科学版);2009年12期
5 李清瑛;吴守雷;;PSC朗读的情感需要[J];白城师范学院学报;2006年02期
6 王如辰;隋英华;;高师大学语文课程教育价值实现的路径探析[J];白城师范学院学报;2010年01期
7 关彦庆;;《普通话水平测试实施纲要》测试用朗读作品指瑕[J];北华大学学报(社会科学版);2006年04期
8 王玲玲;;中介语理论与普通话测试——“目标参照”在普通话测试中的运用[J];北华大学学报(社会科学版);2007年06期
9 张昕;;师范院校普通话教学存在的问题及对策[J];宝鸡文理学院学报(社会科学版);2009年05期
10 陈秀香;;《测试大纲》与普通话教学[J];滨州职业学院学报;2009年02期
中国重要会议论文全文数据库 前10条
1 谢英;;关于PSC“说话”项测试[A];海峡两岸辞书学研讨会暨福建省辞书学会第十七届学术年会论文集[C];2005年
2 PSC国家题库建设课题组;刘照雄;王晖;;普通话水平测试国家题库制卷系统研制报告[A];第二届全国普通话水平测试学术研讨会论文集[C];2004年
3 徐泉;陈佑林;;关于影响普通话水平测试信度和效度因素的分析及对策[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
4 张建强;;略论中介语理论与PSC[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
5 李竹屏;;普通话水平测试在语言测试中的共性与个性[A];第三届全国普通话水平测试学术研讨会论文集[C];2007年
6 钱华;;PSC“说话”测试的学理依据与界域定位[A];第三届全国普通话水平测试学术研讨会论文集[C];2007年
7 王晖;;普通话水平测试评分细则论析[A];第三届全国普通话水平测试学术研讨会论文集[C];2007年
8 单虹;王颐嘉;乔丽华;;普通话水平测试评分细则研究[A];第三届全国普通话水平测试学术研讨会论文集[C];2007年
9 孙海娜;;普通话水平测试“一级甲等”评审的若干问题[A];第三届全国普通话水平测试学术研讨会论文集[C];2007年
10 吴宁锋;;对闽方言区PSC中“二乙”特征的分析和思考[A];第三届全国普通话水平测试学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前4条
1 沈世玘;北京话单音节异读词社会分层研究[D];中央民族大学;2011年
2 魏思;基于统计模式识别的发音错误检测研究[D];中国科学技术大学;2008年
3 陈亚凤;中港新三地的语言规划与新加坡本位小学语文课程研究[D];复旦大学;2007年
4 严可;发音质量自动评测技术研究[D];中国科学技术大学;2012年
中国硕士学位论文全文数据库 前10条
1 杨淑连;小学生阅读速度及其相关因素的调查[D];华东师范大学;2011年
2 杨璐;北京话双音节词重音研究[D];北京大学;2011年
3 何振生;基于多媒体的内蒙古普通话培训研究[D];内蒙古师范大学;2011年
4 丘永春;泰国学生学习汉语量词偏误分析[D];中央民族大学;2011年
5 杨丽芳;泰国中小学生汉语韵母偏误分析及教学策略[D];中央民族大学;2011年
6 刘冉;普通话水平测试朗读作品节律研究[D];湖南科技大学;2011年
7 王宏敏;韩国孔子学院中高级口语课教学状况调查研究[D];东北师范大学;2011年
8 李丹青;对外汉语教学中易混量词研究[D];山东师范大学;2012年
9 黄海峰;汉语普通话轻声词语的音高探析[D];云南师范大学;2005年
10 杜宇虹;普通话水平测试中“说话”项应试策略研究[D];华中师范大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 祁均;梁维谦;;区分性训练算法在英语语音评测中的应用[J];电声技术;2011年08期
2 黄双;李婧;王洪莹;杨军;张波;;基于发音易混淆模型的发音质量评价算法[J];计算机应用;2006年S2期
3 严可;胡国平;魏思;李萌涛;杨晓果;冯国栋;;计算机用于英语背诵题的自动评分技术初探[J];计算机应用与软件;2010年07期
4 魏思;刘庆升;胡郁;王仁华;;普通话水平测试电子化系统[J];中文信息学报;2006年06期
5 刘庆升;魏思;胡郁;郭武;王仁华;;基于语言学知识的发音质量评价算法改进[J];中文信息学报;2007年04期
6 严可;戴礼荣;;基于音素评分模型的发音标准度评测研究[J];中文信息学报;2011年05期
7 郭巧,陆际联;计算机辅助汉语教学系统中语音评价体系初探[J];中文信息学报;1999年03期
8 张兰;;畅言语音教具系统在英语课堂上的应用[J];中国现代教育装备;2011年12期
9 梁维谦,王国梁,刘加,刘润生;基于音素的发音质量评价算法[J];清华大学学报(自然科学版);2005年01期
10 严可;胡国平;魏思;戴礼荣;李萌涛;杨晓果;冯国栋;;面向大规模英语口语机考的复述题自动评分技术[J];清华大学学报(自然科学版);2009年S1期
中国博士学位论文全文数据库 前4条
1 李超雷;交互式语言学习系统中的发音质量客观评价方法研究[D];中国科学院研究生院(电子学研究所);2007年
2 鄢志杰;声学模型区分性训练及其在自动语音识别中的应用[D];中国科学技术大学;2008年
3 魏思;基于统计模式识别的发音错误检测研究[D];中国科学技术大学;2008年
4 刘庆升;计算机辅助普通话发音评测关键技术研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前1条
1 龚澍;基于TANDEM的声学模型区分性训练在语音评测系统中的研究[D];中国科学技术大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 胡俊翘,胡友兰,李德群;改进的基因遗传算法在专家系统机器学习中的应用[J];计算机辅助工程;1994年01期
2 阎明印,栾江南,杨叔子;具有学习功能的机械设备智能诊断系统[J];沈阳工业学院学报;1997年04期
3 高阳;周志华;孙晨;陈兆乾;陈世福;;从FTART网络中抽取if-then规则[J];模式识别与人工智能;1999年04期
4 吴艳;刘建波;;电子邮件自动处理的用户模型设计[J];沈阳化工学院学报;2005年04期
5 胡彩霞;;利用决策树获取搜索结果页面中的匹配数[J];科技咨询导报;2007年06期
6 刘星毅;农国才;;几种不同缺失值填充方法的比较[J];南宁师范高等专科学校学报;2007年03期
7 鲁晓南;接标;;一种基于个性化邮件特征的反垃圾邮件系统[J];计算机技术与发展;2009年08期
8 王存睿;文晋;;基于人脸检测的教室信息智能采集系统[J];大连民族学院学报;2009年05期
9 阎巍;;基于决策树的软件项目估算方法[J];计算机工程与科学;2009年08期
10 王厚峰;;计算语言学歧义消解研究——兼介绍北京大学计算语言学教育部重点实验室[J];术语标准化与信息技术;2010年03期
中国重要会议论文全文数据库 前10条
1 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
2 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 谢世朋;胡茂林;;基于局部仿射区域对稀疏纹理分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
5 张郴;;基于神经网络集成的旅游需求预测模型[A];中国地理学会百年庆典学术论文摘要集[C];2009年
6 吴宪祥;于培松;万旻;倪伟;郭宝龙;;RoboCup中智能体的参数优化和学习[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
7 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 杨磊;黎志成;胡斌;;基于人工神经网络的调度规则确定专家系统[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
9 张燕;张付志;;跨系统个性化服务方法和用户模型研究[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
10 陈时敏;韩心慧;;基于机器学习的网页木马识别方法研究[A];第26次全国计算机安全学术交流会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年
2 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
3 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
4 记者 何边;网络化激活人工智能[N];计算机世界;2001年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 ;门户平台 服务金融[N];中国计算机报;2003年
7 傅秋瑛;默默耕耘数十载 自主创新结硕果[N];科技日报;2006年
8 王育昕吴红梅;高水平原创性科技成果大量涌现[N];新华日报;2008年
9 周惟菁;李宏玮的外包情结[N];21世纪经济报道;2008年
10 冯卫东;科技将这样改变我们的生活[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 张峰;基于统计模式识别发音错误自动检测的研究[D];中国科学技术大学;2009年
2 何斌;基于可拓逻辑的机器学习理论与方法[D];华南理工大学;2005年
3 王国胜;支持向量机的理论与算法研究[D];北京邮电大学;2008年
4 胡崇海;基于图的半监督机器学习[D];浙江大学;2008年
5 刘长安;基于实例归纳的工艺规划方法及集成CAPP系统研究[D];山东大学;2003年
6 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
7 钟志;基于异常行为辨识的智能监控技术研究[D];上海交通大学;2008年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
10 牛晓太;多模式智能谈判支持系统的理论与方法研究[D];武汉大学;2004年
中国硕士学位论文全文数据库 前10条
1 刘孟旭;基于EP的多分类器表决分类算法[D];郑州大学;2004年
2 向光;基于机器学习和数据挖掘的入侵检测技术研究[D];东北大学;2005年
3 亢华爱;入侵检测系统中基于代价敏感分类算法的研究[D];太原理工大学;2005年
4 张金伟;基于Agent网络答疑系统的设计与实现[D];华东师范大学;2006年
5 王晶;支持向量机及其在癌症诊断中的应用研究[D];东北师范大学;2006年
6 万辉;自主载体语义级环境建模和规划的研究与实现[D];沈阳工业大学;2006年
7 黄际洲;聊天机器人知识库自动抽取算法的研究与实现[D];重庆大学;2006年
8 孟祥山;工作流流程优化技术的应用研究[D];国防科学技术大学;2004年
9 芦明;语义网服务中基于机器学习的本体映射研究[D];大连海事大学;2008年
10 马波;支持向量机多类分类算法的分析与设计[D];扬州大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026