收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于稀疏表示的语音增强方法研究

赵彦平  
【摘要】:语音在通信过程中不可避免的受到周围环境噪声的干扰,噪声过大时不仅使人们听不清对方的谈话内容,还容易使人们疲劳,产生烦躁的情绪。所以在接收端要进行去噪声处理,这就是语音增强技术或噪声抑制技术。在不引入新的噪声前提下如何有效的去除噪声又能保持语音不失真是语音增强的目的,从而提高语音信号的质量和可懂度。提高语音质量可以减少听者的疲劳,提高可懂度可以减少失真。语音增强广泛应用于语音识别、语音编码等系统中。在免提设备、助听器等领域的应用也越来越多。除此之外,在人机对话、机器翻译、蓝牙、智能家居等方面也发挥着越来越大的作用。经过几十年的发展,语音增强已经有许多成熟有效的算法,这些算法大致可分为基于谱减的语音增强方法、基于统计模型的语音增强方法、基于信号子空间的语音增强方法以及基于维纳滤波的语音增强方法。 由于经傅里叶变换后的语音信号能量大多集中在低频部分,并且具有良好的去相关特性,语音增强方法中大部分算法都是在短时傅里叶变换域实现的。而有些方面的应用,如在语音编码中,功率谱估计器比幅度谱估计器能获得更好的性能。无论功率谱减法还是幅度平方谱估计器都假设带噪语音信号的功率谱可以表示为纯净语音和噪声功率谱之和,并且功率谱由幅度平方谱近似估计。基于这一假设,本文提出了基于功率谱稀疏表示的语音增强方法。稀疏表示是从一个过完备字典中选择少数原子以线性组合的形式来表示一个信号的全部或大部分信息,可以应用非负矩阵分解或压缩感知等技术获得最稀疏的线性组合。本文利用加非负限制的近似K奇异值分解(K-singular Value Decomposition,K-SVD)方法训练纯净语音的功率谱字典,然后利用最小角回归(LeastAngle Regression,LARS)算法获得纯净语音功率谱的稀疏表示,再把重构的功率谱应用于基于短时幅度谱的信号子空间方法(Signal SubspaceApproach Based on Short-time Spectral Amplitude,SSB-STSA)中,最后结合带噪语音信号的相位和傅里叶逆变换得到纯净语音信号的时域估计。LARS算法是根据估计的噪声功率谱设定一个合理参数作为终止准则的。带噪语音功率谱和稀疏重构得到的功率谱之差的l2范数如果小于设定的参数,算法就终止。由于该方法的噪声功率谱利用带噪语音初始段和静音部分,采用直接判决方法估计,所以只在平稳白噪声环境中可取得较好的增强效果。 因为纯净信号与噪声信号谱之间的相关项不为零,所以把带噪语音信号的功率谱表示为纯净语音和噪声功率谱之和假设是不准确的。利用带噪语音、纯净语音和噪声谱之间的向量关系可以得到相关项的估计,这一估计可以表示为瞬时先验信噪比和瞬时后验信噪比的函数。本文基于相关项不为零的模型提出了新的基于功率谱稀疏表示的语音增强方法。采用最小控制递归平均(Minima Controlled Recursive Averaging,MCRA)方法对噪声的功率谱进行估计。把估计的噪声功率谱和相关项估计之和的l2范数作为LARS算法的终止准则,从而得到纯净语音功率谱的稀疏表示。字典仍然采用加非负限制的K-SVD算法训练得到。而且我们提出了一种利用当前帧而不是前一帧语音功率谱估计瞬时信噪比的方法。由于语音信号在前一帧和当前帧之间是时变的,对语音增强来说利用当前帧来估计瞬时信噪比是非常重要的。新的语音增强方法应用了更合理的语音模型和终止准则,所以适用于更多的噪声类型,尤其在低信噪比环境中获得了更好的估计性能。 大多数语音增强方法都是在频域通过应用增益函数实现的,需要同时估计语音信号功率谱和噪声功率谱。这意味着语音增强系统的性能一部分取决于噪声功率谱估计的准确程度。传统的噪声功率谱估计方法通常利用带噪语音信号起始段或静音部分进行估计,而静音部分需要使用语音活动性检测算法进行检测。语音活动性检测算法只对平稳噪声检测结果较好,然而在低信噪比时误差较大。对于非平稳噪声,功率谱变化较快,所以在估计噪声功率谱时要及时对其进行更新。噪声功率估计过高或过低会产生降低可懂度或引入音乐噪声的不良影响。本文基于低复杂度低时延的无偏最小均方误差噪声功率谱估计方法,提出了基于语音存在概率的噪声功率谱估计方法。该方法基于幅度平方谱语音信号模型,利用由后验信噪比不确定性决定的后验语音存在概率来更新噪声功率谱的估计。该方法得到的噪声功率谱估计的最大值和无偏噪声功率谱估计方法接近,但提高了低估计值,所以很好地估计了噪声又避免了过高估计导致的信号失真。同时该方法又能快速跟踪噪声功率谱的变化,对平稳噪声和非平稳噪声都具有良好的估计效果。 一般认为人耳对正弦信号的相位改变或相对相位的改变不敏感,也有学者认为语音信号中正弦成分相位变化或相位的突然变化会导致语音质量的下降,信号的相位包含了大量的信息。但是基于幅度谱的语音增强算法认为相位信息不能提高语音质量,因而只对幅度谱进行估计,忽略了相位信息。近年来,越来越多的学者关注语音增强中相位的重要性。本文在给定相位的最小均方误差(Minimum Mean-Square Error,MMSE)幅度谱估计器的基础上,提出了一种相位估计方法。该方法利用瞬时先验信噪比和瞬时后验信噪比推导出了相位差的特定表达式,进而利用反余弦函数和带噪语音的相位,得到了纯净语音的相位估计。本文算法是给定相位的MMSE幅度谱估计器补充和扩展,并且这一相位估计算法可以和其它幅度谱估计器相结合,从而提高增强后语音信号的质量。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 马晓红,殷福亮,陆晓燕,王晓宁;基于小波变换的传声器阵列语音增强方法[J];大连理工大学学报;2003年04期
2 徐爽,韩芳芳,郑德忠;基于阈值的小波域语音增强新算法[J];传感技术学报;2004年01期
3 邹采荣;陈国明;赵力;;基于泄漏约束的DF-GSC语音增强(英文)[J];Journal of Southeast University(English Edition);2007年04期
4 彭煊,刘金福,王炳锡;基于独立分量分析的语音增强[J];信号处理;2002年05期
5 沈亚强;基于多分辨率子波变换的自适应滤波语音增强方法[J];浙江工商职业技术学院学报;2003年04期
6 钱永玲;面向NGN的三重播放——7302 ISAM语音增强型接入平台[J];通讯世界;2005年11期
7 李楠;;一种小波变换与维纳滤波结合的语音抗噪研究[J];电声技术;2007年05期
8 张丽艳;殷福亮;;一种改进的奇异值分解语音增强方法[J];电子与信息学报;2008年02期
9 徐岩,杨静,王维汉;基于谱相减改进算法的语音增强研究[J];铁道学报;2004年01期
10 石鸿凌,姜琳峰,孙洪;基于TVAR模型的语音增强技术[J];武汉大学学报(工学版);2004年02期
11 董婧,赵晓晖;基于自适应共轭梯度参数估计的顽健卡尔曼滤波语音增强算法[J];通信学报;2004年08期
12 赵光,贾林飞,王冬霞,王琼;基于神经网络的麦克风阵列语音增强方法[J];辽宁工学院学报;2005年03期
13 王惠琴;何继爱;张秋余;;小波变换在语音增强中的应用[J];甘肃科学学报;2005年04期
14 王月;屈百达;徐保国;;一种基于仿生小波变换的语音增强方法[J];计算机工程与应用;2008年11期
15 刘晓晖,周祎 ,郑明,吴道悌;语音增强系统中宽带噪声的滤除[J];西安交通大学学报;1998年12期
16 孙新德;一种改进的语音增强方法及实现[J];郑州航空工业管理学院学报(社会科学版);2005年04期
17 曹晓琳,吴平,张素莉,丁铁夫;一种基于自适应滤波的语音增强算法的DSP实现[J];电子器件;2005年03期
18 王侠,顾明亮;一种基于小波变换的语音增强新方法[J];徐州师范大学学报(自然科学版);2005年03期
19 陈立伟,赵春晖,杨洪利;一种基于模糊系统的语音增强方法[J];应用科技;2005年10期
20 王永琦 ,邓琛 ,李世超 ,杨洋;噪声环境中基于GMM汉语说话人识别[J];微计算机信息;2005年22期
中国重要会议论文全文数据库 前10条
1 周小星;王安娜;孙红英;杨鸿武;;基于压缩感知过程的语音增强[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
2 陶智;赵鹤鸣;;Bark子波变换在语音增强中的应用[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
3 欧贵文;柯登峰;;基于噪音估计和参数估计的优化语音增强算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 吴红卫;俞一彪;;基于Laplace-Gauss模型和简化相位判别的离散余弦变换域语音增强[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
5 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
6 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年
7 王安娜;周小星;孙红英;杨鸿武;;基于压缩感知过程的语音增强新算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 吴亚栋;吴旭辉;;一种基于自相关域动态噪声估计方式的语音增强法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 丁沛;曹志刚;;基于语音增强失真补偿的抗噪声语音识别技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
2 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年
3 赵彦平;基于稀疏表示的语音增强方法研究[D];吉林大学;2014年
4 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年
5 袁文浩;基于噪声估计的语音增强方法研究[D];华东理工大学;2013年
6 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年
7 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
8 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
9 申丽然;Hilbert-Huang变换及其在含噪语音信号处理中的应用研究[D];哈尔滨工程大学;2006年
10 崔玮玮;基于麦克风阵列的声源定位与语音增强方法研究[D];清华大学;2009年
中国硕士学位论文全文数据库 前10条
1 邬鑫锋;基于短时谱估计的语音增强研究[D];湘潭大学;2010年
2 王春玲;井下载波电话语音增强问题的研究[D];山东科技大学;2003年
3 陶智;基于人耳听觉掩蔽效应的语音增强的研究[D];苏州大学;2003年
4 孔祥波;基于短时幅度谱估计的语音增强方法研究[D];大连理工大学;2000年
5 朱健华;语音增强方法的研究[D];大连理工大学;2002年
6 武睿;数学形态学在语音增强中的应用[D];河北工业大学;2004年
7 段国和;战场环境下的自适应语音增强[D];西北工业大学;2005年
8 王龙;基于DSP的语音增强系统的研究与设计[D];东华大学;2011年
9 缪春波;语音增强及其相关技术的研究[D];大连理工大学;2003年
10 董婧;基于语音增强及小波变换基音检测的LPC-MBE低速语音编码算法[D];吉林大学;2004年
中国重要报纸全文数据库 前10条
1 ;打造三重播放接入平台[N];中国电子报;2005年
2 ;7302 ISAM面向NGN支持三重播放[N];通信产业报;2005年
3 上海贝尔阿尔卡特股份有限公司 汤栩平;上海贝尔阿尔卡特全面备战融合宽带接入[N];通信产业报;2005年
4 曾;科健K3900打头阵[N];计算机世界;2001年
5 ;推进无锡电信网络转型[N];人民邮电;2006年
6 李文;华为EnerG GSM解决方案 持续提升移动网络价值[N];通信产业报;2006年
7 晓林;东信北邮:智能网专家[N];通信产业报;2003年
8 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
9 贝文;上海贝尔阿尔卡特助力江苏电信网络转型[N];通信产业报;2006年
10 王辉;融合通信:向概念化说“不”[N];通信产业报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978