收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于稀疏表示和深度学习的有监督语音增强算法研究

朱媛媛  
【摘要】:作为语言符号系统的载体,语音是人类表达思想和情感的重要工具之一。然而,现实生产生活中无处不在的干扰和噪声使得语音信号经常受到污染,导致语音的质量和可懂度降低,引起人类主观听觉感受的不适,也给语音识别等后端应用带来了挑战。因此,语音增强一直都是语音信号处理领域的一个重要课题,它被具体定义为干净语音在受到来自各种噪声干扰时,利用一定的技术手段抑制和消除噪声,以提升该段语音的质量和可理解性。自20世纪70年代以来,研究学者就开始致力于单通道语音增强算法的研究,相继提出了谱减法、基于统计模型的算法和子空间算法等传统语音增强算法,但这类算法通常需要对语音信号和噪声各自的特性以及彼此是否相关等方面做出一定的前提假设,使其增强性能受到了限制。尤其是在处理非平稳噪声的情况下,往往会引入一些非线性的失真,影响语音的听觉感受以及后端的语音识别编码等处理。近些年来随着科技的进步,语音数据的采集变得快捷方便,基于数据驱动的有监督语音增强算法也应运而生。这类算法的核心思想是通过模型挖掘训练数据的特征和性质,无需依赖任何前提假设,使得这类方法能够适用于相对复杂的声学环境。基于此,本文结合近些年迅速发展的稀疏表示理论和深度学习方法,针对单通道语音增强的有监督算法进行了研究,主要的研究工作如下:首先,在基于互补联合字典学习和稀疏表示的增强算法的基础上进一步考虑在两种噪声共存的嘈杂环境下的语音增强任务。在字典学习阶段,用带噪语音到语音、噪声之间的映射关系约束联合字典的学习,使得字典原子不仅挖掘出信号的谱特征,同时也表征了信号之间的映射关系,丰富了字典的完备性并增强了字典之间的区分性,缓解源混淆和源失真问题。在增强阶段,考虑到在不同条件下各路稀疏表示恢复得到的信号的有效性存在差异,基于估计信号中的归一化残余混淆成分设计加权权重,进行多路估计信号的融合,以进一步提升语音增强的效果。其次,目前大部分的深度学习算法采用的都是频域特征,如短时傅里叶变换幅度谱或者是对数功率谱,而增强语音的相位则由带噪语音的相位来代替,使得增强语音中相位和幅度存在一定的不匹配,导致“不一致语谱”问题。然而与时域采样点相比,时频点能够反映出语音信号在相应频率分量上的能量,而且语音的谐波特征和共振峰等特性在时频域上往往更加明显。针对这一问题,本文提出了基于全卷积网络的端到端单通道语音增强算法,网络模型主要由编码器和解码器构成,但在编码器的输入端和解码器的输出端分别加入了基于卷积层设计的伪傅里叶变换层和伪逆傅里叶变换层,从而引入频域信息以便于网络更好地挖掘语音的特性。此外,采用带门限控制的卷积层搭建编码器和解码器以扩大感受野并更好地控制信息在层次结构中的传递,在编码器和解码器中间加入时域卷积模块以更好地学习语音的长时记忆性。此外,由于提出的端到端模型能够直接以整条语句为单位进行语音增强,所以采用了不同的基于语句的优化目标来训练提出的网络,以此探究代价函数对增强性能的影响。


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 刘鹏;;基于深度学习的语音增强方法研究[J];智能计算机与应用;2019年05期
2 石玲;;基于计算机声卡的谱相减语音增强系统分析[J];信息与电脑(理论版);2010年04期
3 孙涛;;基于计算机声卡的谱相减语音增强系统分析[J];南昌教育学院学报;2010年05期
4 ;研究人员将可控制残差噪声的语音增强方法用于语音通讯[J];高科技与产业化;2020年08期
5 张晓雷;;基于深度学习的语音增强简述[J];网络新媒体技术;2019年02期
6 李璐君;屈丹;;一种基于组合深层模型的语音增强方法[J];信息工程大学学报;2018年04期
7 袁文浩;娄迎曦;梁春燕;夏斌;;利用生成噪声提高语音增强方法的泛化能力[J];电子学报;2019年04期
8 阴法明;唐於烽;;基于深度置信网络的语音增强算法[J];电子器件;2018年05期
9 余华;唐於烽;赵力;;基于改进深度置信网络的语音增强算法[J];数据采集与处理;2018年05期
10 薛慧君;李盛;路国华;张杨;焦腾;王健琪;荆西京;;提升小波用于非接触语音增强算法的研究[J];医疗卫生装备;2013年05期
11 胡海波;刘柏森;许银;;基于小波变换的语音增强研究[J];黑龙江工程学院学报(自然科学版);2011年01期
12 褚伟;;基于条件深度卷积生成对抗网络的语音增强研究[J];智能计算机与应用;2019年04期
13 邓贺元;刘加;夏善红;彭春荣;;一种联合频谱和空间特征的深度学习多通道语音增强算法[J];电子测量技术;2019年18期
14 任济生;任鹏;吉爱国;曹茂永;;基于小波变换的双通道相干语音增强[J];电子器件;2008年04期
15 ;Soata III:E1高密度回音消除和StudioSound级语音增强系统[J];通讯世界;2003年02期
16 裴俊华;贾海蓉;;基于子空间域的自适应小字典的语音增强[J];现代电子技术;2019年01期
17 张行;赵馨;;基于神经网络噪声分类的语音增强算法[J];中国电子科学研究院学报;2020年09期
中国重要会议论文全文数据库 前20条
1 任玉宝;;基于联合字典学习的语音增强算法[A];中国声学学会水声学分会2019年学术会议论文集[C];2019年
2 王世伟;胡笑浒;郑成诗;李晓东;;一种改进的基于能量差语音增强算法[A];中国声学学会第九届青年学术会议论文集[C];2011年
3 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年
4 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
5 童峰;许肖梅;洪青阳;;一种带阶数估计的语音增强算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 袁榕嵘;吴鸣;杨军;;双麦克风语音增强快速算法[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
7 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
8 李海峰;韩纪庆;郑铁然;;元音、辅音粗判自适应电话语音增强方法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
9 高登峰;杨波;郭东岳;;基于深度神经网络的地空通话语音增强方法[A];第一届空中交通管理系统技术学术年会论文集[C];2018年
10 楼厦厦;郑成诗;李晓东;;滤波器权值约束对自适应零限波束形成语音增强算法鲁棒性影响分析[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
11 丁沛;曹志刚;;基于语音增强失真补偿的抗噪声语音识别技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
12 吴亚栋;吴旭辉;;一种基于自相关域动态噪声估计方式的语音增强法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
13 孙俊峰;王新龙;;基于非线性动力学的子空间语音增强[A];2004年全国物理声学会议论文集[C];2004年
14 陆生礼;余崇智;;基于语音特征的语音增强方法[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
15 欧贵文;柯登峰;;基于噪音估计和参数估计的优化语音增强算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
16 罗笑雪;柯雨璇;郑成诗;李晓东;;联合谱和空间特征的深度学习语音增强研究[A];2019年全国声学大会论文集[C];2019年
17 满娟;吴鸣;杨军;;利用谱减法对骨导信号语音增强的研究[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
18 程琳娟;郑成诗;彭任华;李晓东;;基于自适应幅度补偿的深度神经网络语音增强算法研究[A];第十三届全国信号和智能信息处理与应用学术会议论文集[C];2019年
19 欧贵文;柯登峰;;背景噪音的单帧逼近、变换带宽和信噪比加权的语音增强算法[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
20 黄志华;黄浩;胡英;于迎霞;;基于噪声稀疏特性的语音增强算法分析[A];中国声学学会2017年全国声学学术会议论文集[C];2017年
中国博士学位论文全文数据库 前20条
1 张龙;有监督学习条件下的单通道语音增强算法研究[D];中国科学技术大学;2017年
2 夏丙寅;面向移动通信的单通道语音增强方法研究[D];北京工业大学;2014年
3 ;[D];;年
4 高天;复杂环境下基于深度学习的语音信号预处理方法研究[D];中国科学技术大学;2018年
5 童仁杰;基于信号稀疏特性的语音增强算法研究[D];中国科学技术大学;2018年
6 王青;基于深层神经网络的多目标学习和融合的语音增强研究[D];中国科学技术大学;2018年
7 孙琦;基于子空间的低计算复杂度语音增强算法研究[D];吉林大学;2017年
8 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
9 刘威;单通道语音水印与语音增强算法研究[D];东南大学;2017年
10 章雒霏;基于机器学习的双麦克风手机语音增强算法研究[D];南京师范大学;2017年
11 鲍光照;基于稀疏表示和字典学习的语音增强算法研究[D];中国科学技术大学;2015年
12 赵彦平;基于稀疏表示的语音增强方法研究[D];吉林大学;2014年
13 Md Shohidul Islam;小波域中鲁棒性的有监督单通道语音增强[D];中国科学技术大学;2020年
14 江小平;舰载通信系统及其关键技术研究[D];华中科技大学;2007年
15 张文耀;基于匹配跟踪的低位率语音编码研究[D];中国科学院研究生院(软件研究所);2002年
16 马晓红;传声器阵列语音增强中关键技术的研究[D];大连理工大学;2006年
17 王冬霞;麦克风阵列语音增强的若干方法研究[D];大连理工大学;2007年
18 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
19 袁文浩;基于噪声估计的语音增强方法研究[D];华东理工大学;2013年
20 崔玮玮;基于麦克风阵列的声源定位与语音增强方法研究[D];清华大学;2009年
中国硕士学位论文全文数据库 前20条
1 朱媛媛;基于稀疏表示和深度学习的有监督语音增强算法研究[D];中国科学技术大学;2020年
2 周培;基于麦克风阵列语音增强算法的研究及TMS320C6678实现[D];湖南大学;2019年
3 谭纬城;基于频谱补偿的麦克风阵列语音增强算法研究[D];华南理工大学;2019年
4 续娇;基于自适应波束成形的语音增强算法研究与实现[D];北京交通大学;2019年
5 程泽丰;混响环境下的远程语音增强方法研究[D];浙江大学;2019年
6 黄张翼;基于深度神经网络的语音增强方法研究[D];重庆邮电大学;2018年
7 余国修;麦克风阵列语音增强算法研究[D];西安电子科技大学;2019年
8 台龙飞;安全监控中声音识别的研究[D];上海应用技术大学;2019年
9 李湑;单声道语音增强关键技术研究[D];重庆邮电大学;2019年
10 吴晓华;基于听觉感知加权的时域语音增强算法研究[D];南京航空航天大学;2019年
11 叶富强;基于主观听觉反馈的机器学习语音增强模型优化研究[D];哈尔滨工业大学;2019年
12 Guernaz Zineddine;电话和语音识别系统的语音增强[D];哈尔滨工业大学;2019年
13 孙桂琪;基于相空间重构的语音增强方法研究[D];青岛大学;2019年
14 吴卫鹏;基于改进谱减的语音增强算法研究[D];南京邮电大学;2019年
15 张鹤鸣;基于深度学习的语音增强方法研究[D];大连理工大学;2019年
16 张文瑞;基于生成对抗网络的语音增强方法的研究[D];西安电子科技大学;2019年
17 刘建东;基于非负矩阵分解的单通道语音增强系统实现[D];西安电子科技大学;2019年
18 霍陆陆;基于自适应噪声相消的语音增强系统研究[D];西安电子科技大学;2019年
19 潘冬梅;数字助听器中基于深度学习的方向性语音增强算法研究[D];北京工业大学;2019年
20 王虎;基于稀疏表示及二值掩码估计的语音增强算法研究[D];山东科技大学;2018年
中国重要报纸全文数据库 前1条
1 ;NMS Sonata Ⅲ/Studio Sound级语音增强系统话音更清晰[N];中国计算机报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978