收藏本站
《吉林大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计模型的语音增强算法研究

王海艳  
【摘要】:环境噪声是语音处理设备如语音识别系统、说话者辨识系统中广泛存在的一个负面因素。这些系统在没有噪声的环境中具有非常好的语音处理效果,但在实际的噪声环境中,语音处理性能会明显下降很多。剔除语音中的背景噪声是语音信号处理中具有挑战性的问题。由于自然环境中,噪声具有多样性以及语音信号本身的复杂性,语音增强算法也因环境的不同而不同。 语音增强算法的分类方法有很多,依输入信道数量分类,可有单通道语音增强算法、双通道语音增强算法和多通道语音增强算法;依信号处理的域分类,有时域语音增强算法和频域语音增强算法;根据算法的类型又可分为非自适应语音增强算法和自适应语音增强算法。单通道语音增强算法主要应用在如移动通信、助听器等场合。通常,单通道系统利用了语音信号和噪声信号的不同统计特性,在噪声为非平稳时性能不好,同多输入系统相比,它占用资源较少。但是,如何得到性能良好的单通道语音增强算法是这一领域所研究的最困难的问题之一。目前,出现了许多针对不同问题的单通道语音增强算法。 针对语音增强算法由固定长度分帧所导致的语音过渡阶段和清音部分增强效果差的问题,本论文提出了基于清浊音分割算法的语音增强算法。该算法首先利用清浊音分割算法将语音信号中的清浊音分离出来,然后对分离后的清浊音谱幅度分布进行估计,找到更接近于清浊音谱幅度的分布函数,根据清浊音的不同使用不同的谱分布函数进行语音增强。计算机仿真实验验证了这种基于清浊音分离处理算法可有效地提高信噪比,改善语音过渡阶段的增强效果以及清音部分的增强效果。 基于统计模型的语音增强算法是从带噪语音信号中估计出纯净语音信号。这类算法通常要求准确知道纯净语音信号和噪声信号的联合统计量,而且要求具有易理解的失真度量方法。若语音信号和噪声信号是统计独立的,则需要准确的知道纯净语音信号和噪声信号的概率分布。但实际情况是我们既不知道语音信号和噪声信号的统计量也没有最好意义上的失真度量方法。所以,从理论上讲应首先分别训练得出语音信号和噪声信号的统计量,也就是需要一种最优化算法来获得信号的统计模型,然后将该统计模型结合目前能使用的失真度量以得到语音增强算法。 语音增强算法中通常假设语音信号统计独立,短时谱幅度服从瑞利分布。许多语音增强算法致力于找到更为准确的语音信号统计模型来改善语音增强算法。一些统计模型,如超高斯模型如伽玛分布、拉普拉斯分布以及广义超高斯分布已被证明要优于高斯模型。尽管对基于这些模型的语音增强算法研究取得了一些进展,但单一的分布函数并不能够很好模拟语音信号真实的分布柱状图。针对这一问题,本文使用了一种超高斯混合模型为语音信号谱幅度建立模型,采用EM算法对超高斯混合模型中的参数进行估计。这种混合模型能够很好逼近语音信号短时谱幅度柱状图。将该混合模型用于语音增强算法中,得出语音信号短时谱幅度的最小均方误差估计,通过分析该语音增强算法的增益曲线可知超高斯混合模型能够改善语音信号能量较小处的语音增强性能。 很显然,根据语音信号自身的产生原理以及非平稳特性,单一的某一分布并不适用于所有的语音信号。因此改善语音增强算法远非用一种模型来代替另一种模型这样简单,需要更为灵活的模型或模型估计算法以适应语音信号自身的特点。隐马尔科夫模型是一种很好的模型估计算法,目前广泛用于语音识别问题中。尽管偶而会应用于语音增强问题中,但到目前为止,它并没有得到很好的发展,或者只用于噪声信号的模型估计时,这里假设不同性质的语音信号处于隐马尔科夫模型的不同状态,训练纯净语音信号得到的参数模型应能适应语音信号的特点。本文在参数估计过程中对语音每一帧的联合概率做了一定程度的约束处理,避免在训练语音谱幅度的过程中出现无穷大或零值,从而得到了相对合理的语音谱幅度分布估计。论文提出了建立在该模型基础上的语音增强算法。由于用基于信号统计模型的语音增强算法处理语音信号无法判断每一帧带有噪声的信号确切属于隐马尔科夫模型的哪一种状态,在论文中引入自适应方法来选择一种最适合该帧带噪语音信号的谱幅度分布模型。该算法提高了语音信号的信噪比,在一定程度上克服了只使用单一语音谱幅度分布函数带来的问题。
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TN912.35

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 徐会珍;李双田;;一种基于线性预测残差的语音增强算法[J];微计算机应用;2011年06期
2 汤显峰;葛泉波;;基于子带无迹粒子滤波的语音增强算法[J];自动化与仪器仪表;2011年04期
3 沈圆圆;顾济华;陶智;赵鹤鸣;谈雪丹;;基于人类听觉系统的多频带语音增强[J];计算机工程与应用;2011年21期
4 尹向雷;;改进型谱减法在DSP上的实现[J];电声技术;2011年06期
5 马明;;基于谱减法和小波阈值分解的联合消噪算法研究[J];无线互联科技;2011年03期
6 王海艳;赵晓晖;;基于语音清浊音分离的语音增强算法[J];吉林大学学报(工学版);2011年04期
7 叶利剑;唐琪;;双传声器指向性噪声消除在手机中的应用[J];电声技术;2011年06期
8 卢志茂;孙美玲;张春祥;金辉;;基于极值域均值模式分解的语音增强方法[J];系统工程与电子技术;2011年07期
9 邓利娜;黄晓革;;基于频谱减法的语音去噪算法研究[J];电子设计工程;2011年08期
10 班超帆;刘晓明;田雨;;软判决修正下的语音增强算法在数字信号处理器上的实现与优化[J];计算机应用;2011年08期
中国重要会议论文全文数据库 前10条
1 周小星;王安娜;孙红英;杨鸿武;;基于压缩感知过程的语音增强[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
2 沈亚强;程仲文;;基于卡尔曼滤波的语音增强方法[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 史笑兴;王太君;何振亚;;基于主元分析的语音特征提取[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 梁满贵;肖彦;阮秋琦;;双源谐波模型的语音信号清浊音分离[A];中国声学学会2006年全国声学学术会议论文集[C];2006年
5 刘锡华;;40HzAERP在临床法医学鉴定中的应用[A];中国法医学会全国第九次法医临床学学术研讨会论文集[C];2006年
6 洪弘;王新龙;陶智勇;李佩笑;;基于倒谱和EMD的语音基音周期的提取[A];2009年度全国物理声学会议论文集[C];2009年
7 邓立新;杨震;郑宝玉;;一种判别语音静、清、浊三态的新方法[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
8 邓立新;杨震;;一种基于人耳听觉两分性的语音信息隐藏方法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
9 杜安丽;王茜;余磊;孙洪;;基于小波树结构的语音信号压缩感知恢复算法[A];2010年通信理论与信号处理学术年会论文集[C];2010年
10 袁榕嵘;吴鸣;杨军;;双麦克风语音增强快速算法[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 ;打造三重播放接入平台[N];中国电子报;2005年
2 ;7302 ISAM面向NGN支持三重播放[N];通信产业报;2005年
3 上海贝尔阿尔卡特股份有限公司 汤栩平;上海贝尔阿尔卡特全面备战融合宽带接入[N];通信产业报;2005年
4 记者 杨柳纯;HYT携手清华大学研发语音信号技术[N];深圳特区报;2009年
5 ;StudioSound:高性能的语音质量[N];通信产业报;2003年
6 曾;科健K3900打头阵[N];计算机世界;2001年
7 ;推进无锡电信网络转型[N];人民邮电;2006年
8 记者 林若飞通讯员 侯移门;中国首块“会芯”深圳问世[N];深圳商报;2008年
9 杨文生;IP PBX的三代历程[N];计算机世界;2004年
10 杨文生;IP PBX三代变迁[N];网络世界;2004年
中国博士学位论文全文数据库 前10条
1 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
2 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
3 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年
4 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年
5 刘柏森;基于HHT复杂环境下低信噪比语音检测及增强方法研究[D];哈尔滨工程大学;2011年
6 杨杰;基于感知的语音编解码系统研究[D];华中科技大学;2010年
7 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
8 田岚;增强电子耳蜗听感知的处理策略研究[D];天津大学;2009年
9 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
10 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
中国硕士学位论文全文数据库 前10条
1 丁晓敏;强噪声环境下语音增强算法的研究及其DSP实现[D];南京航空航天大学;2010年
2 陈亚芳;无线语音通信降噪技术的研究与实现[D];国防科学技术大学;2005年
3 邬鑫锋;基于短时谱估计的语音增强研究[D];湘潭大学;2010年
4 王龙;基于DSP的语音增强系统的研究与设计[D];东华大学;2011年
5 陶智;基于人耳听觉掩蔽效应的语音增强的研究[D];苏州大学;2003年
6 黄亮;基于DM6446嵌入式平台的语音增强算法实现与优化[D];哈尔滨工业大学;2010年
7 武睿;数学形态学在语音增强中的应用[D];河北工业大学;2004年
8 王春玲;井下载波电话语音增强问题的研究[D];山东科技大学;2003年
9 牛铜;基于子空间的语音增强算法研究[D];解放军信息工程大学;2009年
10 孔祥波;基于短时幅度谱估计的语音增强方法研究[D];大连理工大学;2000年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026