收藏本站
《解放军信息工程大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

连续语音识别的稳健性技术研究

徐望  
【摘要】:说话人差异,信道失真和背景噪声导致训练环境和测试环境不匹配,严重影响了非特定人连续语音识别系统的性能。为提高中文连续语音识别系统的稳健性和自适应能力,本文从信号空间、特征空间和模型空间三个方面对说话人归一化、语音增强、端点检测、特征补偿和不确定解码等关键技术进行了深入研究和分析,提出了一些新的思路和方法,并以大量的实验予以证明。本文主要完成了如下工作: 1.将双线性频率弯折方法引入到声道长度归一化中。传统的频率弯折方法存在声道模型假设过于简单,变换后信号频谱带宽改变的问题。本文根据双线性变换中低通滤波器截止频率的映射公式,求出对齐不同说话人或人群第三共振峰的频率弯折因子。利用该频率弯折因子,对Mel滤波器组的位置和宽度进行双线性变换,得到声道长度归一化的特征矢量。该方法避免了对弯折因子的线性搜索,同时还利用了双线性变换使弯折频谱连续且无带宽改变的优点。实验证明,该方法是一种快速的、尤其适用于无监督模式下的稳健性方法。语音特征参数经过声道长度归一化后,在孤立词识别中,成年男性语料训练的基线系统对成年女性语料的识别率从71.50%提高到了91.00%,对儿童语料的识别率从71.00%提高到了84.00%;在连续语音识别中,男性语料训练的HMM声学模型参数集对女性语料的识别率从13.91%提高到了50.56%。 2.采用高斯混合模型(Gaussian Mixture Model,GMM)分类器对测试语句的信道环境进行分类。在多信道环境下进行语音识别时,当基线系统的信道环境与测试语句的信道环境匹配,识别率要明显高于用某一种信道语料或多种信道语料混合训练的基线系统的识别率。如果用各信道的语料分别建立一个GMM模型,信道的差别就转而体现在各GMM的差别上,且具有可分性。本文用各电话信道的洲练语料训练出相应的GMM信道模型和HMM声学模型,在识别时候,对测试语句进行信道分类,选择相应信道下的HMM声学模型对该语句进行识别。实验结果表明,该方法能有效提高多信道环境下的语音识别率。 3.推导了一种基于离散余弦变换和听觉掩蔽效应的子空间降噪算法。本文采用离散余弦变换来逼近本征分解中的Karhunen-Loeve变换,用基于Johnston掩蔽模型的感知滤波器对降噪后的语音进行后置滤波。该方法利用基于离散余弦变换的本征分解快速算法,可将运算复杂度O(N~3)减少到N~2,同时能有效地抑制残差噪声。 4.提出了特征空间能量熵的定义。当背景噪声为有色噪声或噪声能量可变时,传统的语音端点检测方法往往失效。带噪语音的空间可分为正交的信号加噪声子空间和噪声子空间。语音信号是由确定性的非线性动力系统产生,所以它的能量将集中在信号加噪声子空间。而随机噪声的能量在整个带噪语音空间中近似均匀分布。因此语音和噪声具有不同的空间能量分布,有着不同的空间能量熵。本文对语音信号的协方差矩阵进行本征分解,由特征值求出信号在特征空间能量概率分布,提出了特征空间能量熵的
【学位授予单位】:解放军信息工程大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TN912.34

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 王韵;基于Sphinx的汉语连续语音识别[D];太原理工大学;2010年
2 贾紫娟;汉语语音识别技术研究与实现[D];天津理工大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 赵以宝,孙圣和;一种基于单字统计二元文法的自组词音字转换算法[J];电子学报;1998年10期
2 刘加;汉语大词汇量连续语音识别系统研究进展[J];电子学报;2000年01期
3 李虎生,刘加,刘润生;语音识别说话人自适应研究现状及发展趋势[J];电子学报;2003年01期
4 赵以宝,王祁,聂伟,孙圣和;一种基于数据融合的多话筒语音识别方法[J];计算机研究与发展;1999年09期
5 黄顺珍,方棣棠;基于拼音模型的声学层识别的研究[J];中文信息学报;2002年03期
6 何磊,方棣棠,吴文虎;最大后验估计和加权近邻回归结合的说话人自适应方法[J];清华大学学报(自然科学版);2001年01期
7 董远,胡光锐;多重分形维数在语音分割和语音识别中的应用[J];上海交通大学学报;1999年11期
8 朱杰,韦晓东;噪声环境中基于HMM模型的语音信号端点检测方法[J];上海交通大学学报;1998年10期
9 林嘉宇,王跃科,黄芝平,沈振康;一种新的基于混沌的语音、噪声判别方法[J];通信学报;2001年02期
10 徐望,丁琦,王炳锡;一种基于特征空间能量熵的语音信号端点检测算法[J];通信学报;2003年11期
中国重要会议论文全文数据库 前1条
1 李净;徐明星;张继勇;郑方;吴文虎;方棣棠;;汉语连续语音识别中声学模型基元比较:音节、音素、声韵母[A];第六届全国人机语音通讯学术会议论文集[C];2001年
【共引文献】
中国期刊全文数据库 前10条
1 章森;刘磊;刁麓弘;;基于混合语言模型的中文智能输入技术[J];北京工业大学学报;2007年09期
2 罗元;黄璜;张毅;胡章芳;;一种新的语音端点检测方法及在智能轮椅人机交互中的应用[J];重庆邮电大学学报(自然科学版);2011年04期
3 范影乐;武传艳;李轶;庞全;;基于C_0复杂度的语音端点检测技术研究[J];传感技术学报;2006年03期
4 谢来福;王志萍;易素君;;普通话测试训练系统设计与开发[J];电脑知识与技术(学术交流);2007年12期
5 王坤卿;;HMM模型在语音识别研究中的应用[J];电脑知识与技术;2008年34期
6 林立;朱杰;;基于HTK实时中文语音路名查询系统的设计和实现[J];电子测量技术;2008年03期
7 李娟;刘珩;蔡乃小;;有效抑制短波通信噪声的语音增强算法设计[J];电子测量技术;2010年03期
8 汪涛,胡剑凌;基于低信噪比条件下的VAD算法研究[J];电子工程师;2005年02期
9 朱浩冰;郭东辉;;声纹识别系统原理及其关键技术[J];计算机安全;2007年09期
10 蒋文建,韦岗;基于多时间尺度复合子带噪声语音识别新方法[J];电子学报;2001年S1期
中国重要会议论文全文数据库 前10条
1 陈江;杨鉴;徐永华;;基于发音词典自适应的纳西语口音汉语普通话语音识别[A];第二十九届中国控制会议论文集[C];2010年
2 韩志艳;王健;伦淑娴;王旭;;基于小波包变换的语音信号鲁棒特征提取[A];第二十九届中国控制会议论文集[C];2010年
3 王博;郭英;段艳丽;陈琪;;基于倒谱特征的语音端点检测算法研究[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
4 王月;屈百达;李金宝;蒋纯刚;;一种改进的基于频带方差的端点检测算法[A];2007中国控制与决策学术年会论文集[C];2007年
5 徐望;丁琦;王炳锡;;一种基于高维嵌入的词边界检测算法[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
6 熊军军;马瑞堂;李成荣;;儿童语音识别的研究现状[A];第九届全国人机语音通讯学术会议论文集[C];2007年
7 陶立;赵力;;基于高阶累积量参数的语音寂声段和语声段检测方法[A];2007’促进西部发展声学学术交流会论文集[C];2007年
8 师伟;廖闻剑;;基于Sphinx的音标识别系统[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
9 雷赟;方元;;噪声背景下的语音检测[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 李峰;浦剑涛;李成荣;;基于声韵母建模基元拼接和整词识别的非特定人孤立词语音识别系统的研究[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
3 韩志艳;语音信号鲁棒特征提取及可视化技术研究[D];东北大学;2009年
4 陈伟;语音识别声学建模中的主动学习研究[D];北京邮电大学;2011年
5 吕艳新;被动声目标识别理论研究[D];南京理工大学;2011年
6 付强;语音的参数表示和质量客观评价研究[D];西安电子科技大学;2000年
7 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
8 李玉榕;信息融合与智能处理的研究[D];浙江大学;2001年
9 王志鹏;基于信息融合技术的故障诊断方法的研究及应用[D];大连理工大学;2001年
10 乔斌;粗糙集理论分层递阶约简算法的研究[D];浙江大学;2003年
中国硕士学位论文全文数据库 前10条
1 郭秋雨;小词汇量非特定人的孤立词语音识别系统研究[D];中国海洋大学;2010年
2 吴荣娣;基于特征分类直方图均衡的鲁棒性语音识别研究[D];苏州大学;2010年
3 沈小静;基于小波包变换和支持向量机的中医声诊客观化研究[D];华东理工大学;2011年
4 牛铜;基于子空间的语音增强算法研究[D];解放军信息工程大学;2009年
5 张宝奇;基于切分的汉语连续语音识别技术研究[D];解放军信息工程大学;2010年
6 薛小燕;基于动态贝叶斯网络的连续语音识别研究[D];解放军信息工程大学;2010年
7 戴国徽;手机UMD电子书阅读器的研究与实现[D];东华大学;2011年
8 冯鑫;基于音素的错误发音自动检测方法研究与应用[D];西安电子科技大学;2009年
9 高翔;超球支持向量机在语音识别中的应用研究[D];太原理工大学;2011年
10 江雪峰;关键词识别中语音确认技术的研究[D];华北电力大学(北京);2011年
【同被引文献】
中国期刊全文数据库 前10条
1 陈明义;黎华;;基于Teager能量算子的语音激活检测[J];重庆工学院学报(自然科学版);2007年10期
2 宋倩倩;于凤芹;;基于EMD和改进双门限法的语音端点检测[J];电声技术;2009年08期
3 曾招华;景新幸;杨海燕;;用改进的遗传算法实现语音特征矢量的矢量量化[J];大众科技;2011年04期
4 赵庆卫,王作英,陆大 ;汉语连续语音识别中上下文相关的识别单元(三音子)的研究[J];电子学报;1999年06期
5 李霞,罗雪晖,张基宏;基于人工蚁群优化的矢量量化码书设计算法[J];电子学报;2004年07期
6 纪震;廖惠连;许文焕;姜来;;粒子对算法在图像矢量量化中的应用[J];电子学报;2007年10期
7 张宜;汉语语音识别技术的研究与发展[J];广西广播电视大学学报;2003年04期
8 蔡静平;;语音信号数字处理技术及其军事应用[J];国防科技;2007年09期
9 郝杰,李星;汉语连续语音识别中经典HMM的实验评测[J];计算机工程与应用;2001年13期
10 汉小欢;景新幸;;基于功率谱差分和TEO的语音端点检测[J];计算机应用与软件;2011年04期
中国博士学位论文全文数据库 前2条
1 董婧;鲁棒语音识别技术的研究[D];吉林大学;2007年
2 马龙华;车载环境下语音识别方法研究[D];哈尔滨工程大学;2008年
中国硕士学位论文全文数据库 前10条
1 赵明;基于经验模态分解的语音端点检测算法研究[D];安徽大学;2010年
2 段薇;粒子群优化矢量量化算法在DHMM语音识别中的应用[D];太原理工大学;2011年
3 冯亚楠;基于小波域Teager能量熵的音符起点检测算法研究[D];天津大学;2012年
4 李殷;量子粒子群算法研究及其在图像矢量量化码书设计中的应用[D];南京邮电大学;2012年
5 陈荔龙;连续语音识别搜索算法的研究与应用[D];西北工业大学;2002年
6 孙炯宁;噪声环境下汉语数字语音识别系统的研究[D];南京信息工程大学;2005年
7 王稚慧;基于HMM建模的语音识别算法的研究[D];西安建筑科技大学;2005年
8 肖寒;GPS车载导航系统的语音识别应用与实现[D];浙江大学;2006年
9 梁五洲;抗噪语音识别特征提取算法的研究[D];太原理工大学;2006年
10 马萧;汉语连续语音识别及其在移动机器人导航中的应用[D];西安理工大学;2007年
【二级引证文献】
中国硕士学位论文全文数据库 前5条
1 武文斌;互动智能英语学习系统的研究与实现[D];电子科技大学;2011年
2 江超;视频语义提取分析研究[D];西安电子科技大学;2011年
3 王杰;车内噪声环境下汉语语音识别系统设计[D];吉林大学;2012年
4 戴东良;面向呼叫中心话音服务质量监控的关键词检出技术研究与应用[D];浙江工商大学;2013年
5 张慧珊;基于声纹识别和动态密码的双因素身份认证系统的研究与实现[D];武汉理工大学;2013年
【二级参考文献】
中国期刊全文数据库 前8条
1 李虎生,杨明杰,刘润生;汉语数码语音识别自适应算法[J];电路与系统学报;1999年02期
2 李建东,李明远,纪红;话音活动检测的模型及其在移动通信中的应用[J];电信科学;1995年10期
3 林嘉宇,黄芝平,王跃科,沈振康;语音信号相空间重构中嵌入维数的选择[J];电子科学学刊;1999年06期
4 周强;;基于语料库和面向统计学的自然语言处理技术[J];计算机科学;1995年04期
5 俞士汶,朱学锋,王惠,张芸芸;现代汉语语法信息词典规格说明书[J];中文信息学报;1996年02期
6 郑方,牟晓隆,徐明星,武健,宋战江;汉语语音听写机技术的研究与实现[J];软件学报;1999年04期
7 黄顺珍,方棣棠;利用语言模型实现音字转换的高效解码算法[J];深圳大学学报;2000年04期
8 林嘉宇,王跃科,黄芝平,沈振康;语音信号相空间重构中时间延迟的选择──复自相关法[J];信号处理;1999年03期
中国重要会议论文全文数据库 前2条
1 方棣棠;李树青;;汉语语音输入的研究现状与发展前景[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 贾川;张健;陈振标;徐波;;噪声环境下的端点检测算法研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 俞一彪,袁保宗;连续语音识别中句法结构知识的利用[J];电子学报;1990年06期
2 谢锦辉,潘小兵;连续语音识别系统性能评估软件[J];计算机应用与软件;1994年02期
3 吴及,刘丰,王作英;连续语音识别系统中测度计算的快速算法研究[J];清华大学学报(自然科学版);1999年05期
4 茅力群;;利用HMM提取连续语音中的口型信息[J];微计算机信息;2006年02期
5 王鸿儒;杨根科;杨祖华;;基于HTK的连续语音识别网站系统的研究和实现[J];微型电脑应用;2010年07期
6 李易军,徐近霈,吴枫;用于连续语音识别的RBF-Gamma-HMM组合模型[J];电子学报;1999年09期
7 付跃文,杜利民;语音识别错误的分类分析[J];计算机应用;2005年02期
8 ;听觉不错 Voice Xpress简化了Word控制,增加了连续语音识别[J];每周电脑报;1998年19期
9 叶虹;;基于仿生模式识别的非特定人连续语音识别的研究[J];浙江工业大学学报;2006年04期
10 ;让中国的计算机“听话”——中文语音识别产品步入实用化阶段[J];互联网周刊;1999年27期
中国重要会议论文全文数据库 前10条
1 王之禹;温源;侯震;李明;;多发音字典在连续语音识别中的应用[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 包叶波;胡郁;刘聪;江辉;戴礼荣;刘庆峰;;中文连续语音识别系统音素建模单元集的构建[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
3 包叶波;胡郁;刘聪;江辉;戴礼荣;刘庆峰;;中文连续语音识别系统音素建模单元集的构建[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 黄泰翼;高雨青;;计算机语音识别的最新进展和展望[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
5 柴佩琪;;基于本征值的汉语音节切分方法[A];第三届全国人机语音通讯学术会议论文集[C];1994年
6 马芹;苏广川;;基于音节分割的连续语音识别方法的研究[A];第二届全国人机语音通讯学术会议论文集[C];1992年
7 那斯尔江·吐尔逊;吾守尔·斯拉木;麦麦提艾力;;维吾尔语大词汇量连续语音识别研究——语音语料库的建立[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 吴伟民;林道发;杨家沅;;连续密度HMM用于非特定人的汉语连续语句识别的尝试[A];第三届全国人机语音通讯学术会议论文集[C];1994年
9 谢锦辉;李晖;;大型线性预测HMM及其在汉语音素识别中的应用[A];第三届全国人机语音通讯学术会议论文集[C];1994年
10 郑方;吴文虎;方棣棠;;连续无限制语音流中关键词识别的研究现状[A];第四届全国人机语音通讯学术会议论文集[C];1996年
中国重要报纸全文数据库 前10条
1 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
2 ;人机对话无障碍[N];中国计算机报;2002年
3 孙忠法;我可以选择我的成功[N];中国人事报;2006年
4 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
5 冰梅;全面展现人性化设计[N];计算机世界;2000年
6 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
7 本报实习记者 朱泉峰;“无求品自高”[N];计算机世界;2005年
8 本报记者  文杰;李开复:一不小心成了“校园教父”[N];成都日报;2006年
9 北京清华大学电子工程系副教授 刘加 教授 刘润生;让机器听懂我的话[N];科技日报;2001年
10 郑千里;回家以后:他们响亮了中国之“声”[N];科技日报;2003年
中国博士学位论文全文数据库 前5条
1 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
2 吴斌;语音识别中的后处理技术研究[D];北京邮电大学;2008年
3 孙成立;语音关键词识别技术的研究[D];北京邮电大学;2008年
4 鄢志杰;声学模型区分性训练及其在自动语音识别中的应用[D];中国科学技术大学;2008年
5 黄浩;基于区分性原理的汉语语音识别中声调问题的研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 湛宗儒;连续语音识别算法研究及在嵌入式系统上的实现[D];武汉理工大学;2010年
2 徐双印;连续语音识别中的区分性训练技术[D];解放军信息工程大学;2013年
3 张利娟;基于CRF和SVM的连续语音识别研究[D];天津师范大学;2013年
4 薛小燕;基于动态贝叶斯网络的连续语音识别研究[D];解放军信息工程大学;2010年
5 武晓敏;基于Julius的维吾尔语连续语音识别研究[D];新疆大学;2012年
6 薛蕾;基于HMM和代数神经网络的连续语音识别研究[D];西北大学;2010年
7 张宝奇;基于切分的汉语连续语音识别技术研究[D];解放军信息工程大学;2010年
8 卜素亮;非特定人连续语音识别技术研究与应用[D];复旦大学;2011年
9 谢磊;连续语音识别中声学模型的建立[D];西北工业大学;2002年
10 尹明明;连续语音识别解码技术的研究[D];解放军信息工程大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026