收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度神经网络的语音增强算法研究

张馨  
【摘要】:语音增强,也称语音降噪,目的是减弱与抑制背景噪声对目标语音的干扰,从而提高语音的质量和清晰度。语音增强技术普遍运用于人们生活和工作中,是语音信号处理中尤为重要的部分。传统的单声道语音增强方法需要提前对语音与噪声信号做出假设,这导致它们的降噪性能有一定的限制。近年来随着信息网络的普及,数据集规模的增大以及计算机运算速度的提升,深度神经网络的优势得到了体现。深度神经网络相比于传统的语音增强方法的优势在于其不需要提前做出假设。本文主要的研究内容是采用深度神经网络的方法实现语音增强,利用深度神经网络强大的数据分析能力对带噪语音到纯净语音的映射关系进行拟合。整个语音增强系统分为准备阶段、训练阶段和增强阶段。准备阶段作为网络训练的前期处理工作,生成大量平行的语音数据并提取语音信号的特征,训练阶段通过反向传播过程迭代更新深度神经网络的参数,增强阶段将带噪语音通过已训练的网络进行处理,得到增强语音信号。考虑到人耳对语音的非线性感知能力,本文将语音对数功率谱的映射模型作为本文的基线系统。针对部分语音失真的情况,本文提出将语音的幅度谱特性与对数功率谱特征联合的方法。在深度神经网络的输入端拼接这两种特征,令网络同时学习和优化这两种不同的目标,这使得网络能学到不同特征之间的差异和共性,在增强阶段通过后处理方法融合两种特征,得到最终的增强语音信号。实验表明,特征联合优化的方法较明显地提高了低信噪比带噪语音的语音质量和清晰度,缓解了语音失真的情况。为进一步提高降噪性能,本文还采用跳接思想,即将原始输入数据跳跃地堆叠到每个隐藏层输出端,与输出做拼接处理,再作为下一个隐藏层的输入。这使原始输入数据得以重复利用,每个网络层学习到的特征更加复杂多样化。最后本文结合上述思想提出一种方案,即在联合优化语音对数功率谱和幅度谱特征的同时,将输入的对数功率谱特征进行跳接堆叠。该方案使含不匹配噪声的带噪语音的PESQ(Perceptual Evaluation of Speech Quality)结果提高了0.47,表明语音质量有明显的改善,也体现出改进的增强系统具有良好的降噪能力和泛化能力。


知网文化
【相似文献】
中国期刊全文数据库 前14条
1 黄张翼;周翊;舒晓峰;刘宏清;;联合贝叶斯估计与深度神经网络的语音增强方法[J];小型微型计算机系统;2019年01期
2 蓝天;惠国强;李萌;吕忆蓝;刘峤;;采用上下文相关的注意力机制及循环神经网络的语音增强方法[J];声学学报;2020年06期
3 李璐君;屈丹;;一种基于组合深层模型的语音增强方法[J];信息工程大学学报;2018年04期
4 袁文浩;梁春燕;夏斌;孙文珠;;一种融合相位估计的深度卷积神经网络语音增强方法[J];电子学报;2018年10期
5 袁文浩;娄迎曦;梁春燕;夏斌;;利用生成噪声提高语音增强方法的泛化能力[J];电子学报;2019年04期
6 张行;赵馨;;基于神经网络噪声分类的语音增强算法[J];中国电子科学研究院学报;2020年09期
7 徐思颖;屈丹;;基于正则化的深度神经网络语音增强自适应方法[J];信息工程大学学报;2018年05期
8 时文华;张雄伟;邹霞;孙蒙;李莉;;联合深度编解码网络和时频掩蔽估计的单通道语音增强[J];声学学报;2020年03期
9 石玲;;基于计算机声卡的谱相减语音增强系统分析[J];信息与电脑(理论版);2010年04期
10 褚伟;;基于条件深度卷积生成对抗网络的语音增强研究[J];智能计算机与应用;2019年04期
11 刘鹏;;基于深度学习的语音增强方法研究[J];智能计算机与应用;2019年05期
12 余华;唐於烽;赵力;;基于改进深度置信网络的语音增强算法[J];数据采集与处理;2018年05期
13 任济生;任鹏;吉爱国;曹茂永;;基于小波变换的双通道相干语音增强[J];电子器件;2008年04期
14 孙涛;;基于计算机声卡的谱相减语音增强系统分析[J];南昌教育学院学报;2010年05期
中国重要会议论文全文数据库 前20条
1 高登峰;杨波;郭东岳;;基于深度神经网络的地空通话语音增强方法[A];第一届空中交通管理系统技术学术年会论文集[C];2018年
2 程琳娟;郑成诗;彭任华;李晓东;;基于自适应幅度补偿的深度神经网络语音增强算法研究[A];第十三届全国信号和智能信息处理与应用学术会议论文集[C];2019年
3 王世伟;胡笑浒;郑成诗;李晓东;;一种改进的基于能量差语音增强算法[A];中国声学学会第九届青年学术会议论文集[C];2011年
4 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年
5 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
6 童峰;许肖梅;洪青阳;;一种带阶数估计的语音增强算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
7 袁榕嵘;吴鸣;杨军;;双麦克风语音增强快速算法[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
8 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 李海峰;韩纪庆;郑铁然;;元音、辅音粗判自适应电话语音增强方法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 楼厦厦;郑成诗;李晓东;;滤波器权值约束对自适应零限波束形成语音增强算法鲁棒性影响分析[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
11 任玉宝;;基于联合字典学习的语音增强算法[A];中国声学学会水声学分会2019年学术会议论文集[C];2019年
12 丁沛;曹志刚;;基于语音增强失真补偿的抗噪声语音识别技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
13 孙俊峰;王新龙;;基于非线性动力学的子空间语音增强[A];2004年全国物理声学会议论文集[C];2004年
14 吴亚栋;吴旭辉;;一种基于自相关域动态噪声估计方式的语音增强法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
15 欧贵文;柯登峰;;基于噪音估计和参数估计的优化语音增强算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
16 罗笑雪;柯雨璇;郑成诗;李晓东;;联合谱和空间特征的深度学习语音增强研究[A];2019年全国声学大会论文集[C];2019年
17 陆生礼;余崇智;;基于语音特征的语音增强方法[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
18 满娟;吴鸣;杨军;;利用谱减法对骨导信号语音增强的研究[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
19 黄志华;黄浩;胡英;于迎霞;;基于噪声稀疏特性的语音增强算法分析[A];中国声学学会2017年全国声学学术会议论文集[C];2017年
20 欧贵文;柯登峰;;背景噪音的单帧逼近、变换带宽和信噪比加权的语音增强算法[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
中国博士学位论文全文数据库 前20条
1 江文斌;面向复杂场景的极低码率语音编解码和语音增强关键技术研究[D];上海交通大学;2018年
2 高天;复杂环境下基于深度学习的语音信号预处理方法研究[D];中国科学技术大学;2018年
3 童仁杰;基于信号稀疏特性的语音增强算法研究[D];中国科学技术大学;2018年
4 王青;基于深层神经网络的多目标学习和融合的语音增强研究[D];中国科学技术大学;2018年
5 孙琦;基于子空间的低计算复杂度语音增强算法研究[D];吉林大学;2017年
6 夏丙寅;面向移动通信的单通道语音增强方法研究[D];北京工业大学;2014年
7 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
8 张龙;有监督学习条件下的单通道语音增强算法研究[D];中国科学技术大学;2017年
9 章雒霏;基于机器学习的双麦克风手机语音增强算法研究[D];南京师范大学;2017年
10 刘威;单通道语音水印与语音增强算法研究[D];东南大学;2017年
11 徐勇;基于深层神经网络的语音增强方法研究[D];中国科学技术大学;2015年
12 肖理业;基于机器学习的电磁场建模与设计研究[D];电子科技大学;2019年
13 陈涵瀛;核电站热工水力系统工况预测与诊断方法研究[D];哈尔滨工程大学;2018年
14 梁智杰;聋哑人手语识别关键技术研究[D];华中师范大学;2019年
15 刘昂;微结构硅基光子学器件性能的研究[D];南京大学;2019年
16 赵博雅;基于卷积神经网络的硬件加速器设计及实现研究[D];哈尔滨工业大学;2018年
17 杜昌顺;面向细分领域的舆情情感分析关键技术研究[D];北京交通大学;2019年
18 陈科海;机器翻译上下文表示方法研究[D];哈尔滨工业大学;2019年
19 饶红霞;信息受限下神经网络的状态估计和拟同步研究[D];广东工业大学;2019年
20 张马路;Spiking机器学习算法研究[D];电子科技大学;2019年
中国硕士学位论文全文数据库 前20条
1 张馨;基于深度神经网络的语音增强算法研究[D];哈尔滨工业大学;2019年
2 时勇强;基于深度神经网络的语音增强算法研究[D];北京工业大学;2016年
3 李瑞;多通道语音增强方法的研究[D];大连理工大学;2008年
4 周培;基于麦克风阵列语音增强算法的研究及TMS320C6678实现[D];湖南大学;2019年
5 谭纬城;基于频谱补偿的麦克风阵列语音增强算法研究[D];华南理工大学;2019年
6 续娇;基于自适应波束成形的语音增强算法研究与实现[D];北京交通大学;2019年
7 程泽丰;混响环境下的远程语音增强方法研究[D];浙江大学;2019年
8 黄张翼;基于深度神经网络的语音增强方法研究[D];重庆邮电大学;2018年
9 余国修;麦克风阵列语音增强算法研究[D];西安电子科技大学;2019年
10 台龙飞;安全监控中声音识别的研究[D];上海应用技术大学;2019年
11 李湑;单声道语音增强关键技术研究[D];重庆邮电大学;2019年
12 吴晓华;基于听觉感知加权的时域语音增强算法研究[D];南京航空航天大学;2019年
13 叶富强;基于主观听觉反馈的机器学习语音增强模型优化研究[D];哈尔滨工业大学;2019年
14 Guernaz Zineddine;电话和语音识别系统的语音增强[D];哈尔滨工业大学;2019年
15 孙桂琪;基于相空间重构的语音增强方法研究[D];青岛大学;2019年
16 吴卫鹏;基于改进谱减的语音增强算法研究[D];南京邮电大学;2019年
17 张鹤鸣;基于深度学习的语音增强方法研究[D];大连理工大学;2019年
18 张文瑞;基于生成对抗网络的语音增强方法的研究[D];西安电子科技大学;2019年
19 刘建东;基于非负矩阵分解的单通道语音增强系统实现[D];西安电子科技大学;2019年
20 霍陆陆;基于自适应噪声相消的语音增强系统研究[D];西安电子科技大学;2019年
中国重要报纸全文数据库 前20条
1 记者 董映璧;神经网络技术检测玻璃钢缺陷精度高[N];科技日报;2020年
2 骆无意;图神经网络让集群无人系统更智能[N];中国航天报;2020年
3 张允硕 姜正义 甄海锋 河南理工大学;基于神经网络的自适应PID控制的智能衣架[N];科学导报;2019年
4 湖北日报全媒记者 张爱虎 通讯员 徐向军 实习生 于蓝;一群“90后”率先建成铁路“神经网络”[N];湖北日报;2019年
5 记者 刘霞;忆阻器制成神经网络更高效[N];科技日报;2017年
6 整理 本报记者 诸玲珍 顾鸿儒;微软神经网络切割法可使加速作用超线性[N];中国电子报;2018年
7 ;神经网络小史[N];电子报;2018年
8 张敏;人机大战,到底谁会赢?[N];北京日报;2017年
9 ;人工智能将取得大面积突破[N];中国企业报;2017年
10 本报记者 龚丹韵;人机大战:人类还有优势吗[N];解放日报;2017年
11 ;人类正迎来云端机器人时代[N];中国企业报;2017年
12 张斌;谁还需要“同传”[N];文汇报;2017年
13 邓洲 中国社会科学院工业经济研究所;深度学习:人工智能进入应用阶段[N];上海证券报;2017年
14 中国科学技术大学终身学习实验室博士 吴茂乾;“寒武纪”人工智能大爆发的前夜[N];安徽日报;2017年
15 记者 邱智丽;AI竞赛 中国力量崛起[N];第一财经日报;2017年
16 卡内基·梅隆大学计算机科学学院机器学习系主任 Tom Mitchell;突破人类和机器的边界[N];中国信息化周报;2017年
17 舒年;“深度学习”与人工智能的新挑战[N];工人日报;2017年
18 记者 刘霞;新神经网络使计算机像人一样推理[N];科技日报;2017年
19 本报记者 喻思娈;人工智能有多智能?[N];人民日报;2017年
20 中国信息通信研究院标准所副所长 何宝宏;AI技术的天花板[N];通信产业报;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978