收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

文本语音匹配的研究和应用

陶冶  
【摘要】: 语言是人类最重要的交流工具,而文字则是人类用来记录语言的符号。随着多媒体、计算机网络和语音识别技术的高速发展,文本语音匹配成为基于内容的音频和多媒体数据分析和计算机辅助语言教学等领域中的十分重要的问题。文本语音匹配是以语音识别系统的核心技术为基础,对参考文本和对应语音进行强制对准的过程,其目的在于获得语音与文本之间的时间对应关系,从而用于模型训练、语音评价、媒体检索、广播电视出版等多个领域。 作为语音识别领域的关键技术之一,文本语音匹配算法的研究多年来受到研究人员的普遍关注。近年来,该领域的研究主要集中在尝试利用各种方法来提高匹配的准确率和鲁棒性,包括环境音素的影响,对超长语料的处理,以及对不完全匹配的文本和语音进行匹配等方面。本文在系统论述目前国内外文本语音匹配技术发展现状的基础上,针对大量连续语料和不完全匹配语料给出了对准方法,以解决对准过程中存在的性能和失配问题,在此基础上设计和实现了一个对准引擎,并应用于智能英语口语训练平台的内容制作和语音评分,主要工作和创新点包括: 1.提出一种基于模糊逻辑的多特征音频分类算法。该算法将语音似然度(speech likelihood)的概念和模糊逻辑理论引入到音频分类的研究中,综合考虑音频片段的多维特征,利用模糊逻辑推理系统标识其中的语音部分。实验表明,该方法可显著改善分类性能。 2.提出一种改进的基于扩展匹配网络的容错对准算法。该算法通过对匹配网络进行扩展,对局部的单词和短语级别的插入、删除和替换错误均可进行检测,有效地提高了传统的强制对准算法的准确性。 3.提出一种适用于大量连续语料和非完全匹配语料的对准算法。该算法将大规模文本语音的对准问题转化为一个多阶段决策过程的最优化问题,进而应用动态规划思想进行求解,以解决大量连续语料在文本语音匹配过程中存在的失配问题。实验表明,结合相应的纠错和剪枝策略,该算法的匹配准确性和鲁棒性均得到大幅提高。 4.在上述算法研究的基础上,结合自然语言处理技术和语音评分技术,设计并实现了一个适用于大量连续语料和不完全匹配语料的对准引擎。 该引擎已应用于互动英语教学系统的内容制作和计算机辅助的口语评分,由该引擎提供支持的包括TALKPAL~(TM)语音评价系统等在内的多个e-Learning教育平台已投入使用,并获得了来自南美、欧洲、亚洲等地区的用户的良好反馈。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郑亚敏;;从互文性理论析中国古诗文化意象的英译[J];吉林化工学院学报;2011年08期
2 陈芳;;文本、受众与体验——用媒介文化理论解读“新媒体电影”走热的现象[J];东南传播;2011年08期
3 刘晶瑜;;浅析电视民生新闻文本的叙事特点[J];才智;2011年23期
4 邹燕飞;于成尊;赵亮;;基于Lucene的文本搜索引擎的设计和实现[J];计算机与现代化;2011年09期
5 白鹭;;金钱下异化的人性——《真心话大冒险》的电视文化分析[J];学理论;2011年20期
6 ;办公快操作[J];电脑迷;2011年17期
7 刘晖;;从文本角度看电视剧对受众的说服效果[J];中国广播电视学刊;2011年07期
8 陈爱霞;姚文连;;网文表格去留 当然自做主[J];电脑迷;2011年12期
9 牟晓东;;我用OneNote来OCR[J];电脑知识与技术(经验技巧);2011年08期
10 南亦民;;基于XFS4041CN中文语音系统设计及实现[J];安徽电子信息职业技术学院学报;2011年04期
11 卢秀梅;;让语文课堂成为学生交流互动的舞台[J];青年记者;2011年23期
12 潘小军;;重回“80”年代(三)[J];电子世界;2011年06期
13 吴玉仑;;大型电视节目的文本写作[J];中国电视;2011年06期
14 青锋;;不一样的笔记本[J];电子世界;2010年01期
15 ;我院学生在国际速录大赛获大奖[J];河北软件职业技术学院学报;2011年03期
16 盛建东;;光影深处的温暖[J];出版广角;2011年07期
17 薛慧;;以“Jobs”一课为例谈阅读能力培养[J];现代教学;2011年06期
18 陈发鸿;;基于核方法的文本极性分类研究[J];海峡科学;2011年08期
19 张华英;;议WORD字处理软件应用技巧[J];企业家天地;2011年06期
20 Zoom.Quiet;;我的工具箱[J];程序员;2010年07期
中国重要会议论文全文数据库 前10条
1 李晓栋;胡清华;;汽轮机故障诊断文本支持系统的研究与建立[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
2 赵宬斐;黄丽萍;;浙江外来新居民的生活空间发展检视——以店口为例[A];“秩序与进步:浙江社会发展60年研究”理论研讨会暨2009浙江省社会学年会论文集[C];2009年
3 易绵竹;南振兴;李绍哲;薛恩奎;;文本生成与理解的语言学模拟——伊戈尔·梅里丘克《意思(?)文本》模型评介[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 胡洁;;浅谈习作教学中的“对话性格”[A];江苏省教育学会2005年小学语文优秀论文集[C];2005年
5 沈志斌;白清源;;基于加权修正的KNN文本分类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
6 张鹏;李国臣;李茹;刘海静;石向荣;;基于FrameNet框架关系的文本蕴含识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 单大甫;周斌;黄九鸣;;基于CAAR算法的文本倾向性分析技术[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
8 徐代刚;唐常杰;于中华;;从Web文档中采掘语言知识[A];第十五届全国数据库学术会议论文集[C];1998年
9 周继军;杨著;钮心忻;杨义先;;文本信息隐藏检测算法研究[A];第九届全国青年通信学术会议论文集[C];2004年
10 何菊文;巫成贵;;在情境中体验,在对话中享受[A];江苏省教育学会2005年小学语文优秀论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年
2 金锋;文档摘要算法的研究与应用[D];清华大学;2011年
3 宋胜利;文本语义表示及多层分类关键技术研究[D];西安电子科技大学;2012年
4 富世平;敦煌变文的口头传统研究[D];四川大学;2005年
5 刘顺利;文本研究[D];中国社会科学院研究生院;2002年
6 彭青龙;“写回”帝国中心[D];华东师范大学;2005年
7 李雁南;近代日本文学中的“中国形象”[D];暨南大学;2005年
8 曹海军;文本与语境:罗尔斯正义理论研究[D];吉林大学;2006年
9 张学波;媒体素养教育的课程发展取向研究[D];华南师范大学;2005年
10 吴致远;技术的后现代诠释[D];东北大学;2006年
中国硕士学位论文全文数据库 前10条
1 徐晴阳;从网页中精确提取链接上下文相关文本[D];吉林大学;2004年
2 何固佳;原语文本的解码模式[D];湖南师范大学;2004年
3 陈晓华;程乃珊笔下上海想象的变迁及其社会文化语境[D];首都师范大学;2004年
4 李旺欣;语文对话教学研究[D];上海师范大学;2006年
5 苏平萍;初中语文对话教学个案研究[D];广西师范大学;2006年
6 杨黎丽;爱的缺失与张爱玲文本的悲剧性[D];郑州大学;2007年
7 任云岚;论《管家》中的不确定性[D];河北师范大学;2009年
8 未怡;论《七姐妹》的重生主题[D];四川外语学院;2011年
9 潘莹;基于需求文本的GIS语义挖掘初步研究[D];南京师范大学;2004年
10 王光阵;玩出来的品牌帝国[D];四川大学;2005年
中国重要报纸全文数据库 前10条
1 周平远;文本学研究的创新[N];中华读书报;2005年
2 高红;六方会谈:共同文件最终文本缘何难产?[N];新华每日电讯;2005年
3 记者 孙贤程;新版文本:五大突出问题应调整[N];建筑时报;2011年
4 安徽 高伟;文本批量替换好帮手[N];电脑报;2004年
5 廖令鹏;围炉写作与文本盛宴[N];文艺报;2011年
6 黄宾堂 (壮族);生气勃勃的文本[N];文艺报;2010年
7 李永波;实现滚动文本一例[N];中国电脑教育报;2004年
8 红桥区教师进修学校 孙晓军;深入解读文本 实现有效教学[N];天津教育报;2010年
9 沈传亮;推动历史大众化的文本途径[N];学习时报;2011年
10 林茨;“纪实”文本《百褶裙》[N];中华读书报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978