收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于模型的语音增强方法及质量评估研究

尹伟  
【摘要】:根据对语音信号处理方式的不同,语音增强算法可以分为两类:基于模型的方法和非模型的方法。相对于基于模型的增强方法,非模型的方法在一些方面有不足之处。有些非模型的方法需要两个麦克风,分别做为噪声和语音的输入。但是通常这是很难实现的,特别是某些需要实时处理的应用,比如在助听器上的应用。非模型的方法的一个较大的缺点在于必须假定噪声是相对平稳的,当噪声变化过快时,其效果不能令人满意。而且有些非模型的方法还会引入音乐噪声,比如常用的谱减法。基于模型的方法利用语音信号在时域中的统计特性或短时相关特性等来研究具有针对性的噪声消除技术。基于模型的方法从其增强机理就避免了音乐噪声的产生,可以很好地处理非平稳噪声。 本文以随机信号处理技术作为理论工具,采用动态模型对语音建模,研究了几种基于模型的语音增强方法,其目的是改进现有语音增强算法的性能。另一方面,本文还对语音质量的主观和客观评价方法进行了研究。全文的主要研究内容如下: 1.在子带H∞滤波构架上,提出了一种结合人耳听觉掩蔽特性的单通道语音增强方法。该方法不用对激励噪声和附加噪声的统计特性做出假设。将语音信号分解为子带信号,采用迭代H∞滤波估计出子带信号的低阶AR参数。在对子带噪声进行估计时引入噪声掩蔽阈值,提高了H∞滤波的效果,减少了语音失真。仿真实验结果表明,该算法不仅降低了计算量,而且在主观和客观测试中都获得了更好的增强效果。 2.由于发音的差异或发声方法的差别,不同说话人对同一音素发音时能级并不相同。HMM模型并不能明确地描述这种差异。在HMM模型的框架下,通过对语音增益的参数化和建模来解决上述问题。语音HMM模型和时不变的增益参数通过训练数据在离线时得到,而时变的参数通过观测到的带噪语音在线更新。通过并行的H∞滤波器对带噪语音进行处理,由滤波器输出的加权和计算出对干净语音的估计。引入IMM(交互式多模型)算法使并行的滤波器能有效地交互,在不显著增加计算复杂度的情况下改进增强性能。通过实验表明,文中提出的增强方法能有效地去除背景噪声,处理后的语音失真也比较小。 3.针对含有色噪声的语音,提出了一种基于Unscented粒子滤波的单通道语音增强方法。采用时变AR模型对干净语音和噪声建模,通过Unscented粒子滤波器估计AR模型的参数并滤除有色噪声。与大多数常用的粒子滤波选择的建议分布不同,Unscented粒子滤波器采用Unscented卡尔曼滤波器生成粒子滤波的建议分布。由于在粒子的更新过程中考虑了最近的观测值,Unscented粒子滤波器能够在粒子数少于传统粒子滤波算法所需粒子数目的基础上改善估计的性能。仿真实验结果表明,在有色噪声背景下该算法具有良好的语音增强效果。 4.为了预测经过增强算法处理后的语音质量,评估了几种客观测度的性能。在对干净语音混入三种噪声,分别对六类增强算法进行增强处理,并通过文中介绍的客观测度测试增强算法引入的失真。对增强后的语音质量进行主观测试时采用ITU-T P.835中提出的主观测试方法,从语音信号失真等级、背景噪声等级和语音整体质量三方面评估增强后的语音质量。最后,采用多元自适应回归分析技术得到与主观质量高度相关的一种新的组合客观测度。 5.提出了一种新的基于GMM-HMM模型和非均匀线形预测倒谱系数的客观语音质量评估方法。提取干净语音的非均匀线形预测倒谱系数用来对GMM-HMM模型进行训练。通过训练给干净语音建立参考模型。由参考模型和失真语音的非均匀线形预测倒谱系数向量可以得到它们之间的一致性测度。最后,通过多元非线性回归模型建立主观MOS分和一致性测度之间的映射关系,可以得到对MOS分的客观预测模型。通过这一模型进行语音质量的客观评价,实验表明,文中所提出的基于输出的客观语音质量评估算法的性能要好于ITU-T P.563标准中提出的算法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 马晓红,殷福亮,陆晓燕,王晓宁;基于小波变换的传声器阵列语音增强方法[J];大连理工大学学报;2003年04期
2 沈亚强;基于多分辨率子波变换的自适应滤波语音增强方法[J];浙江工商职业技术学院学报;2003年04期
3 徐爽,韩芳芳,郑德忠;基于阈值的小波域语音增强新算法[J];传感技术学报;2004年01期
4 邹采荣;陈国明;赵力;;基于泄漏约束的DF-GSC语音增强(英文)[J];Journal of Southeast University(English Edition);2007年04期
5 李楠;;一种小波变换与维纳滤波结合的语音抗噪研究[J];电声技术;2007年05期
6 张丽艳;殷福亮;;一种改进的奇异值分解语音增强方法[J];电子与信息学报;2008年02期
7 袁伟军;刘珩;;基于短时对数谱估计MMSE的语音增强算法研究[J];电声技术;2007年10期
8 董婧,赵晓晖;基于自适应共轭梯度参数估计的顽健卡尔曼滤波语音增强算法[J];通信学报;2004年08期
9 费珍福,王树勋,何凯;分形理论在语音信号端点检测及增强中的应用[J];吉林大学学报(信息科学版);2005年02期
10 王月;屈百达;徐保国;;一种基于仿生小波变换的语音增强方法[J];计算机工程与应用;2008年11期
11 徐岩,杨静,王维汉;基于谱相减改进算法的语音增强研究[J];铁道学报;2004年01期
12 赵光,贾林飞,王冬霞,王琼;基于神经网络的麦克风阵列语音增强方法[J];辽宁工学院学报;2005年03期
13 吴周桥;一种语音增强算法的研究[J];武汉科技学院学报;2005年10期
14 李兵;;一种基于子空间分解的语音增强算法[J];中南民族大学学报(自然科学版);2006年02期
15 张华卫;刘金虎;李楠;;基于小波变换的多尺度多阈值的语音增强算法[J];科技资讯;2007年31期
16 孙浩;袁慧梅;;二次离散小波变换的语音增强方法[J];计算机工程与应用;2009年31期
17 刘晓晖,周祎 ,郑明,吴道悌;语音增强系统中宽带噪声的滤除[J];西安交通大学学报;1998年12期
18 曹晓琳,吴平,张素莉,丁铁夫;一种基于自适应滤波的语音增强算法的DSP实现[J];电子器件;2005年03期
19 王侠,顾明亮;一种基于小波变换的语音增强新方法[J];徐州师范大学学报(自然科学版);2005年03期
20 王永琦 ,邓琛 ,李世超 ,杨洋;噪声环境中基于GMM汉语说话人识别[J];微计算机信息;2005年22期
中国重要会议论文全文数据库 前10条
1 周小星;王安娜;孙红英;杨鸿武;;基于压缩感知过程的语音增强[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
2 赵亚丽;付中华;谢磊;张健;张艳宁;;双麦克风语音增强和杂混模型训练相结合的顽健说话人确认[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 王安娜;周小星;孙红英;杨鸿武;;基于压缩感知过程的语音增强新算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 陶智;赵鹤鸣;;Bark子波变换在语音增强中的应用[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
5 吴亚栋;吴旭辉;;一种基于自相关域动态噪声估计方式的语音增强法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
6 袁榕嵘;吴鸣;杨军;;双麦克风语音增强快速算法[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
7 沈亚强;程仲文;;基于卡尔曼滤波的语音增强方法[A];第二届全国人机语音通讯学术会议论文集[C];1992年
8 欧贵文;柯登峰;;基于噪音估计和参数估计的优化语音增强算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
9 尹巧萍;吴海宁;赵力;;含噪语音信号端点检测方法的研究[A];2008’促进中西部发展声学学术交流会论文集[C];2008年
10 吴红卫;俞一彪;;基于Laplace-Gauss模型和简化相位判别的离散余弦变换域语音增强[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
中国博士学位论文全文数据库 前10条
1 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
2 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年
3 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年
4 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
5 刘柏森;基于HHT复杂环境下低信噪比语音检测及增强方法研究[D];哈尔滨工程大学;2011年
6 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
7 申丽然;Hilbert-Huang变换及其在含噪语音信号处理中的应用研究[D];哈尔滨工程大学;2006年
8 田岚;增强电子耳蜗听感知的处理策略研究[D];天津大学;2009年
9 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
10 崔玮玮;基于麦克风阵列的声源定位与语音增强方法研究[D];清华大学;2009年
中国硕士学位论文全文数据库 前10条
1 邬鑫锋;基于短时谱估计的语音增强研究[D];湘潭大学;2010年
2 王龙;基于DSP的语音增强系统的研究与设计[D];东华大学;2011年
3 陶智;基于人耳听觉掩蔽效应的语音增强的研究[D];苏州大学;2003年
4 王春玲;井下载波电话语音增强问题的研究[D];山东科技大学;2003年
5 武睿;数学形态学在语音增强中的应用[D];河北工业大学;2004年
6 孔祥波;基于短时幅度谱估计的语音增强方法研究[D];大连理工大学;2000年
7 冯炎;基于噪声估计和先验信噪比估计的语音增强算法研究[D];西南交通大学;2010年
8 朱健华;语音增强方法的研究[D];大连理工大学;2002年
9 丁晓敏;强噪声环境下语音增强算法的研究及其DSP实现[D];南京航空航天大学;2010年
10 段国和;战场环境下的自适应语音增强[D];西北工业大学;2005年
中国重要报纸全文数据库 前10条
1 ;打造三重播放接入平台[N];中国电子报;2005年
2 ;7302 ISAM面向NGN支持三重播放[N];通信产业报;2005年
3 上海贝尔阿尔卡特股份有限公司 汤栩平;上海贝尔阿尔卡特全面备战融合宽带接入[N];通信产业报;2005年
4 曾;科健K3900打头阵[N];计算机世界;2001年
5 ;推进无锡电信网络转型[N];人民邮电;2006年
6 ;StudioSound:高性能的语音质量[N];通信产业报;2003年
7 李文;华为EnerG GSM解决方案 持续提升移动网络价值[N];通信产业报;2006年
8 晓林;东信北邮:智能网专家[N];通信产业报;2003年
9 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
10 贝文;上海贝尔阿尔卡特助力江苏电信网络转型[N];通信产业报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978