收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于稀疏表示和字典学习的语音增强算法研究

鲍光照  
【摘要】:语音是人们进行语言交流的重要信息载体,但是在现实环境里,语音信号往往会被各种类型的干扰和噪声所污染。被污染的语音不仅会在主观上使人产生听觉厌恶和疲劳,而且还会严重影响语音信号的可懂度。语音增强的目的就是抑制和消除被污染语音中的干扰和噪声,从而提高语音的质量和可懂度。根据污染源类型的不同,可以将语音增强分为语音分离和语音降噪问题,其中前者的污染源是干扰语音,而后者的污染源是背景噪声。传统的语音分离和语音降噪算法在一定条件下能取得比较好的性能,但是也存在一定的局限性。例如,源信号个数比混合信号多的欠定语音分离问题一直是一个难题;在语音降噪问题中,传统方法对非平稳噪声的抑制能力往往有限。本文结合稀疏表示和字典学习理论,针对上述两个难题开展研究,提出了若干算法用于语音分离和降噪,主要的工作和创新点包括: 首先,针对欠定语音分离问题,提出了基于语音双层稀疏模型的欠定语音分离算法。该算法包含两步,在第一步,我们首先对混合信号每个时频点邻域平均得到协方差矩阵,然后对该矩阵进行奇异值分解,筛选出能够较好满足窗联合正交假设的时频点进行聚类,得到较为精确的混合矩阵估计。在第二步,基于语音信号能量都集中在低频的特性,提出了双层稀疏模型,把语音信号分解成低频和高频两层。将基于此模型训练出的双层字典用于语音分离,能够降低不同源信号在字典上投影支撑集的重合度,以提高分离性能。在仿真实验,我们将所提的混合矩阵估计算法和基于双层稀疏模型的语音分离算法与传统方法进行了比较,以验证所提算法的有效性。 其次,针对单通道语音分离问题,提出了基于区分性字典学习和基于分层字典学习的单通道语音分离算法。传统方法分别独立地学习每个源对应的子字典,而没有同时利用不同子字典之间的相互约束关系,从而将源信号在复合字典上进行稀疏表示的时候,其部分成分会投影在非对应子字典上,即混淆投影存在,此时字典区分性不够,分离性能不佳。针对此问题,我们提出了区分性字典学习方法,即联合考虑不同子字典之间的关系,使得每个源信号能够在复合字典中的对应子字典上进行稀疏表示,而抑制其在非对应子字典上的表示。进一步,考虑到单层区分性字典学习方法在单通道语音分离中还是留有一定的混淆投影,我们又提出了分层字典学习方法,在多个层次上对字典进行约束,减少混淆投影,增加字典的区分性。为了验证所提算法的优越性,我们给出了仿真实验,对比所提的区分性字典学习及分层字典学习和传统方法的单通道语音分离性能。 最后,针对语音降噪问题,提出了语音和噪声联合字典学习方法和信号-特征字典学习方法。传统方法独立的学习一个语音字典和一个噪声字典,再将语音和噪声的混合信号在复合字典上进行稀疏表示来达到降噪的目的。但是这样做会导致较为严重的源混淆,即部分语音成分会被噪声字典解释,而部分噪声成分会被语音字典解释。为了增加语音字典和噪声字典的区分性和差异性,我们利用带噪信号和干净信号的训练样本,约束训练样本在对应字典上稀疏表示的近似误差和字典之间的相干性,联合训练语音字典和噪声字典,从而使得它们在增强阶段能够尽量减少语音和噪声的混淆。另外,为了利用语音和噪声信号每个时频点及其邻域的相关性,提出了一种基于邻域权重信息的特征提取方法,并且通过约束信号和特征在对应的信号字典和特征字典上具有相同的稀疏表示系数,来联合学习信号字典和特征字典,然后在增强阶段,直接利用信号字典估计出一路语音信号,利用特征字典生成的时频掩码可以估计出另一路语音信号,将这两路语音信号进行加权,从而得到最终增强的语音。仿真实验对比了所提的联合字典学习和信号-特征字典学习相比于传统方法对非平稳噪声的抑制能力。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郑轶;蔡体健;;稀疏表示的人脸识别及其优化算法[J];华东交通大学学报;2012年01期
2 段菲;章毓晋;;一种面向稀疏表示的最大间隔字典学习算法[J];清华大学学报(自然科学版);2012年04期
3 李仲生;李仁发;蔡则苏;赵乘麟;;稀疏表示下的非监督显著对象提取[J];电子学报;2012年06期
4 段菲;章毓晋;;基于多尺度稀疏表示的场景分类[J];计算机应用研究;2012年10期
5 胡正平;李静;白洋;;基于样本-扩展差分模板的联合双稀疏表示人脸识别[J];信号处理;2012年12期
6 姜芳芳;;稀疏表示理论在提高数字图像质量中的应用[J];科技创新导报;2012年36期
7 马莉娜;;增强的两阶段测试样本稀疏表示方法[J];福建电脑;2013年07期
8 尹学忠;樊甫华;;基于字典学习的超宽带信号稀疏表示与降噪方法[J];计算机应用研究;2014年06期
9 张佳宇;彭力;;基于联合动态稀疏表示方法的多图像人脸识别算法[J];江南大学学报(自然科学版);2014年03期
10 陈才扣;喻以明;史俊;;一种快速的基于稀疏表示分类器[J];南京大学学报(自然科学版);2012年01期
11 陈垚佳;张永平;;图像过完备稀疏表示理论及应用综述[J];电视技术;2012年17期
12 查长军;孙南;张成;韦穗;;基于稀疏表示的特定目标识别[J];吉林大学学报(工学版);2013年01期
13 张涛;梁德群;王新年;;基于稀疏表示的图像模糊度评价方法[J];计算机工程;2013年04期
14 朱启兵;杨宝;黄敏;;基于核映射稀疏表示分类的轴承故障诊断[J];振动与冲击;2013年11期
15 王国权;张扬;李彦锋;王丽芬;马晓梅;;一种基于稀疏表示的图像去噪算法[J];工业仪表与自动化装置;2013年05期
16 丁昕苗;李兵;胡卫明;郭文;王振翀;;基于多视角融合稀疏表示的恐怖视频识别[J];电子学报;2014年02期
17 张石清;赵小明;楼宋江;闯跃龙;郭文平;陈盈;;一种局部敏感的核稀疏表示分类算法[J];光电子.激光;2014年09期
18 范少萍;郑春厚;王召兵;;基于元样本稀疏表示分类器的文本资源分类[J];图书情报工作;2011年16期
19 翟懿奎;甘俊英;徐颖;曾军英;;快速稀疏表示指背关节纹识别及其并行实现[J];吉林大学学报(工学版);2012年S1期
20 段菲;章毓晋;;有监督子空间建模和稀疏表示的场景分类[J];中国图象图形学报;2012年11期
中国重要会议论文全文数据库 前3条
1 何爱香;刘玉春;魏广芬;;基于稀疏表示的煤矸界面识别研究[A];虚拟运营与云计算——第十八届全国青年通信学术年会论文集(上册)[C];2013年
2 樊亚翔;孙浩;周石琳;邹焕新;;基于元样本稀疏表示的多视角目标识别[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
3 葛凤翔;任岁玲;郭鑫;郭良浩;孙波;;微弱信号处理及其研究进展[A];中国声学学会水声学分会2013年全国水声学学术会议论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 李小薪;稀疏表示的分段匹配寻踪方法[D];华南理工大学;2009年
2 何艳敏;稀疏表示在图像压缩和去噪中的应用研究[D];电子科技大学;2011年
3 宋相法;基于稀疏表示和集成学习的若干分类问题研究[D];西安电子科技大学;2013年
4 匡金骏;基于稀疏表示的图像分类与目标跟踪研究[D];重庆大学;2013年
5 李海山;基于稀疏表示理论的地震信号处理方法研究[D];中国石油大学(华东);2013年
6 邓承志;图像稀疏表示理论及其应用研究[D];华中科技大学;2008年
7 路锦正;基于稀疏表示的图像超分辨率重构技术研究[D];电子科技大学;2013年
8 尹海涛;面向图像融合和图像复原的稀疏表示研究[D];湖南大学;2012年
9 谢成军;图像稀疏表示模型在可视化追踪中的应用研究[D];合肥工业大学;2014年
10 欧卫华;基于稀疏表示和非负矩阵分解的部分遮挡人脸识别研究[D];华中科技大学;2014年
中国硕士学位论文全文数据库 前10条
1 张琨雨;在线字典训练及加权差异性稀疏表示的研究[D];大连理工大学;2011年
2 王勇;基于稀疏表示的人脸识别研究[D];五邑大学;2013年
3 李义真;基于词包与稀疏表示的场景分类[D];华南理工大学;2013年
4 孙丽花;基于稀疏表示的人脸识别方法研究[D];河南科技大学;2013年
5 陈天娇;基于分组稀疏和权重稀疏表示的人脸识别研究[D];安徽大学;2014年
6 刘自成;基于稀疏表示的雷达目标角度与距离估计[D];西安电子科技大学;2014年
7 李立;基于稀疏表示的人脸图像识别方法研究[D];南京理工大学;2012年
8 满江月;基于稀疏表示的代价敏感性人脸识别算法研究[D];南京邮电大学;2012年
9 赵广銮;稀疏表示在图像识别中的应用[D];北京邮电大学;2013年
10 罗燕龙;基于局部稀疏表示模型的在线字典学习跟踪算法研究[D];厦门大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978