收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

噪声鲁棒语音识别中若干问题的研究

雷建军  
【摘要】: 随着语音识别技术的不断发展,当前的语音识别系统在纯净环境下对朗读语音的识别可以达到非常高的识别精度。但是无处不在的噪声带来了训练和测试环境之间的不匹配,语音识别系统的性能在噪声环境中急剧下降。噪声鲁棒性问题成为了语音识别达到真正实用所必须解决的关键问题。本文在总结和分析现有噪声鲁棒语音识别技术的基础上,对信号空间和特征空间的语音增强、特征补偿、特征规整、语音激活检测等问题进行了研究,具体的工作及创新包括以下几个方面: 1.对现有的噪声鲁棒语音识别技术进行讨论,并根据语音识别系统的构成将噪声鲁棒语音识别技术按照信号空间、特征空间和模型空间的鲁棒语音识别技术进行分类总结。在详细介绍各种噪声鲁棒性方法的基础上,阐述了噪声鲁棒语音识别研究的主要问题。 2.基于高斯混合模型的两级Mel弯曲维纳滤波。为了解决基于短时谱估计的语音增强算法中先验信噪比估计误差较大的问题,提出了一种基于高斯混合模型的先验信噪比估计方法。在语音增强过程中,语音谱和先验信噪比利用训练好的高斯混合模型计算得到,然后将得到的先验信噪比应用到传统的语音增强系统中。语音增强实验表明,该算法避免了传统语音增强系统中由于先验信噪比通过回归平均获得所导致的先验信噪比估计粗糙的弊端,提高了语音增强系统的性能。在得到基于高斯混合模型的先验信噪比估计方法的基础上,将这种先验信噪比估计方法用于ETSI分布式语音识别标准中的两级Mel弯曲维纳滤波算法,得到基于高斯混合模型的两级Mel弯曲维纳滤波算法,显著提高了语音识别系统的噪声鲁棒性。 3.改进的基于MVA特征规整的鲁棒语音识别算法。在研究基于MVA(Mean-Variance Normalization,ARMA filter)的特征规整算法基础上,提出结合语音增强与特征规整的鲁棒语音识别算法。前端采用最小均方误差对数谱幅度估计语音增强算法对含噪语音进行处理,由于增强后的语音仍然含有残余噪声,会影响语音识别系统的性能。因此,在后端采用MVA特征规整进一步降低增强语音和纯净语音之间的不匹配。实验表明,我们提出的算法提高了语音识别系统的噪声鲁棒性。同时,提出了将特征补偿与MVA特征规整相结合的算法,并研究了不同的结合形式,得到了最佳的结合方案,提高了语音识别系统的性能。 4.改进的基于似然比测试的语音激活检测。深入研究了基于似然比测试的语音激活检测算法,并对基于直接决策似然比测试的语音激活检测算法和基于平滑似然比测试的语音激活检测算法进行了讨论。提出将高斯混合模型引入基于似然比测试的语音激活检测算法中,利用高斯混合模型对纯净语音谱进行建模,得到改进的基于高斯混合模型的似然比测试算法,提高了语音激活检测算法的噪声鲁棒性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王振力;裴凌波;于元斌;;一种基于噪声对消与倒谱均值相减的鲁棒语音识别方法[J];智能系统学报;2008年06期
2 袁伟军;刘珩;;基于短时对数谱估计MMSE的语音增强算法研究[J];电声技术;2007年10期
3 李冲泥,胡光锐;一种改进的子波域语音增强方法[J];通信学报;1999年04期
4 马晓红,殷福亮,陆晓燕,王晓宁;基于小波变换的传声器阵列语音增强方法[J];大连理工大学学报;2003年04期
5 徐爽,韩芳芳,郑德忠;基于阈值的小波域语音增强新算法[J];传感技术学报;2004年01期
6 邹采荣;陈国明;赵力;;基于泄漏约束的DF-GSC语音增强(英文)[J];Journal of Southeast University(English Edition);2007年04期
7 彭煊,刘金福,王炳锡;基于独立分量分析的语音增强[J];信号处理;2002年05期
8 沈亚强;基于多分辨率子波变换的自适应滤波语音增强方法[J];浙江工商职业技术学院学报;2003年04期
9 徐岩,杨静,王维汉;基于谱相减改进算法的语音增强研究[J];铁道学报;2004年01期
10 石鸿凌,姜琳峰,孙洪;基于TVAR模型的语音增强技术[J];武汉大学学报(工学版);2004年02期
11 董婧,赵晓晖;基于自适应共轭梯度参数估计的顽健卡尔曼滤波语音增强算法[J];通信学报;2004年08期
12 赵光,贾林飞,王冬霞,王琼;基于神经网络的麦克风阵列语音增强方法[J];辽宁工学院学报;2005年03期
13 钱永玲;面向NGN的三重播放——7302 ISAM语音增强型接入平台[J];通讯世界;2005年11期
14 王惠琴;何继爱;张秋余;;小波变换在语音增强中的应用[J];甘肃科学学报;2005年04期
15 李楠;;一种小波变换与维纳滤波结合的语音抗噪研究[J];电声技术;2007年05期
16 张丽艳;殷福亮;;一种改进的奇异值分解语音增强方法[J];电子与信息学报;2008年02期
17 王月;屈百达;徐保国;;一种基于仿生小波变换的语音增强方法[J];计算机工程与应用;2008年11期
18 刘晓晖,周祎 ,郑明,吴道悌;语音增强系统中宽带噪声的滤除[J];西安交通大学学报;1998年12期
19 孙新德;一种改进的语音增强方法及实现[J];郑州航空工业管理学院学报(社会科学版);2005年04期
20 曹晓琳,吴平,张素莉,丁铁夫;一种基于自适应滤波的语音增强算法的DSP实现[J];电子器件;2005年03期
中国重要会议论文全文数据库 前10条
1 王振力;白志强;陈浩;;融合噪声对消与CMS的鲁棒语音识别[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
2 王建波;林本浩;田春明;刘睿;;语音增强及其相关技术研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
3 许从方;丛键;;语音增强中的噪声谱估计算法研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
4 周小星;王安娜;孙红英;杨鸿武;;基于压缩感知过程的语音增强[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
5 陶智;赵鹤鸣;;Bark子波变换在语音增强中的应用[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
6 吴红卫;俞一彪;;基于Laplace-Gauss模型和简化相位判别的离散余弦变换域语音增强[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
7 欧贵文;柯登峰;;基于噪音估计和参数估计的优化语音增强算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
8 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年
10 王安娜;周小星;孙红英;杨鸿武;;基于压缩感知过程的语音增强新算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
中国博士学位论文全文数据库 前10条
1 雷建军;噪声鲁棒语音识别中若干问题的研究[D];北京邮电大学;2007年
2 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年
3 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
4 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年
5 沈海峰;语音识别中的环境补偿研究[D];北京邮电大学;2006年
6 徐望;连续语音识别的稳健性技术研究[D];解放军信息工程大学;2006年
7 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年
8 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
9 董舒翼;通信业知识产权发展影响因素研究[D];北京邮电大学;2011年
10 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
中国硕士学位论文全文数据库 前10条
1 王龙;基于DSP的语音增强系统的研究与设计[D];东华大学;2011年
2 孙晶;语音增强算法研究[D];吉林大学;2006年
3 叶斌;语音增强技术在数字通信中的应用[D];东华大学;2006年
4 邬鑫锋;基于短时谱估计的语音增强研究[D];湘潭大学;2010年
5 王春玲;井下载波电话语音增强问题的研究[D];山东科技大学;2003年
6 陶智;基于人耳听觉掩蔽效应的语音增强的研究[D];苏州大学;2003年
7 孔祥波;基于短时幅度谱估计的语音增强方法研究[D];大连理工大学;2000年
8 朱健华;语音增强方法的研究[D];大连理工大学;2002年
9 武睿;数学形态学在语音增强中的应用[D];河北工业大学;2004年
10 段国和;战场环境下的自适应语音增强[D];西北工业大学;2005年
中国重要报纸全文数据库 前10条
1 徐砚;北邮网院创建节约型企业见成效[N];人民邮电;2005年
2 钟凌江;探索创新模式 促进校企合作[N];人民邮电;2005年
3 李刚;网御神州和北京邮电大学成立信息安全联合实验室[N];中国计算机报;2007年
4 ;丽景科技与北邮合作开发手机广告平台[N];人民邮电;2008年
5 本报记者 李昕;什么才是真正的推动力[N];通信产业报;2002年
6 记者 纪秀君;教育部与信息产业部共建北邮[N];中国教育报;2005年
7 姚春鸽;北邮隆重举行建校50周年庆祝大会[N];人民邮电;2005年
8 杨靖;北邮联合培养项目力促中英高等教育合作[N];科技日报;2008年
9 本报记者 李云杰;布局下一代电信网络[N];计算机世界;2003年
10 本报记者 顾莹;在特殊时代开启智力源泉[N];通信产业报;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978