收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度神经网络的语音增强目标函数设计研究

柴丽  
【摘要】:语音在传输过程中总是受到背景噪声干扰,导致语音被严重污染,极大地降低了语音的质量和可懂度,进而影响后续语音应用。语音增强是指从混合带噪语音中提取出纯净语音,抑制、降低噪声干扰的技术。它常作为前端语音信号处理技术,服务于后端语音应用。面向不同后端语音应用,语音增强的目的也不相同。比如对于语音通信应用,语音增强的目的是提高语音的人耳听感。而对于语音识别应用,语音增强的目的是将带噪语音转换为对环境失真不敏感同时包含足量判别信息的特征,作为输入送入语音识别系统,获得更高的识别准确率。随着深度学习在语音识别中获得成功,深度神经网络(Deep Neural Network,DNN)在语音增强中的应用也成为当下的研究热点。基于DNN的语音增强通常利用回归DNN学习带噪语音到干净语音的映射,并取得了显著优于传统单声道语音增强算法的性能。从机器学习的角度来说,基于DNN的语音增强的难点在于复杂的非凸目标函数的优化。最小均方误差(Minimum Mean Squared Error,MMSE)是DNN语音增强模型常用的一种目标函数,然而其容易造成严重的过平滑问题,且跟后续的语音应用的目标之间存在差异,约束增强算法的性能上限。目标函数对网络训练至关重要,在同等训练条件下,更优的目标函数可以训得更好的模型。另外,当前智能语音被成功应用到各种智能硬件产品中,实现人机交互。定制化和个性化是这些智能产品发展的新方向。本文主要研究面向不同后端语音应用或者特定声学场景定制设计DNN语音增强模型的目标函数。首先,本文对MMSE进行了改进。从统计的角度来说,MMSE可以视作独立等方差高斯误差分布假设下的最大似然解。然而对DNN语音增强模型输出误差的统计分析发现其分布呈尖峰肥尾状,且各维上的方差不同。所以本文提出利用广义高斯分布(Generalized Gaussian Distributions,GGD)重新对预测误差进行建模,推导出对数似然函数作为新的目标函数,并引入最大似然估计法对网络参数和GGD参数同时优化。实验证明了基于GGD的最大似然目标函数显著好于传统的MMSE训练准则。此外,对DNN语音增强模型输出误差的进一步统计分析发现其分布并不是严格对称的,非对称的拉普拉斯分布(Asymmetric Laplace Distribution,ALD)被用来对误差重新建模,在概率框架下推导出对数似然函数作为新的目标函数。并从实验和理论两方面对引入的非对称参数进行分析,发现其可以调控语音增强网络的优化方向,这为后端语音应用定制前端增强算法提供了可行性方案。然后,面向语音识别应用,本文首先提出了一个利用时间同步的干净和带噪语音数据对度量语音增强算法识别性能的客观评价指标。它定义为DNN-HMM声学模型输出的干净和带噪语音的状态后验概率分布的交叉熵。实验证明了它与语音识别性能的强相关性。然后考虑到该指标是可导的,所以很容易将其直接用作DNN语音增强模型的目标函数,指导增强网络朝着提高识别准确率的方向优化。最终提高了后端识别系统的噪声鲁棒性。最后,面向低资源下特定说话人的语音增强,本文在最大似然目标函数的基础上提出了基于KL散度正则化的目标函数,即利用KL散度统计说话人无关模型和特定说话人模型输出的条件概率分布间的距离,然后作为正则化项加到主目标函数中,约束特定说话人模型不要偏离说话人无关模型太远。该目标函数实现了将说话人无关模型很好地适应到特定说话人模型上,减轻了由于特定说话人干净语料过少导致的过拟合问题。此外,采用迁移学习策略进一步减少过拟合。最终利用仅不到1分钟的特定说话人干净语料就能实现比大数据集的多条件训练语料训得的说话人无关模型更好的语音质量和可懂度。


知网文化
【相似文献】
中国期刊全文数据库 前14条
1 鲍长春;项扬;;基于深度神经网络的单通道语音增强方法回顾[J];信号处理;2019年12期
2 黄张翼;周翊;舒晓峰;刘宏清;;联合贝叶斯估计与深度神经网络的语音增强方法[J];小型微型计算机系统;2019年01期
3 田源;陈文臣;;深度神经网络在语音增强的两种模型中的研究与比较[J];信息技术与信息化;2020年11期
4 王晓艺;;基于深度神经网络方法的机器在线翻译系统设计[J];电子设计工程;2020年18期
5 冯畅;;正线性函数在深度神经网络中的研究[J];计算机工程与设计;2015年03期
6 杨莹;张海仙;;基于卷积神经网络的图像分类研究[J];现代计算机(专业版);2016年05期
7 龙望晨;王索;罗定福;刘红;;深度神经网络在城市交通预测中的应用[J];电脑知识与技术;2021年16期
8 童瀛;周宇;姚焕章;梁剑;薛虎;;深度神经网络的网络高敏感信息预警算法[J];西安工程大学学报;2021年01期
9 毕仁万;陈前昕;熊金波;刘西蒙;;面向深度神经网络的安全计算协议设计方法[J];网络与信息安全学报;2020年04期
10 张萌;张经纬;李国庆;吴瑞霞;曾晓洋;;面向深度神经网络加速芯片的高效硬件优化策略[J];电子与信息学报;2021年06期
11 刘绪荣;张玮;黄之文;朱坚民;;基于深度神经网络的滑动结合面参数识别研究[J];农业装备与车辆工程;2021年10期
12 刘鹏;;基于混合深度神经网络的语音增强方法研究[J];智能计算机与应用;2019年06期
13 黄威;石佳影;;基于深度神经网络的语音识别研究[J];现代计算机(专业版);2016年07期
14 王兴宾;侯锐;孟丹;;深度神经网络的对抗样本攻击与防御综述[J];广州大学学报(自然科学版);2020年04期
中国重要会议论文全文数据库 前20条
1 高登峰;杨波;郭东岳;;基于深度神经网络的地空通话语音增强方法[A];第一届空中交通管理系统技术学术年会论文集[C];2018年
2 张婷;刘允刚;;基于改进卷积神经网络的语音分离方法[A];第36届中国控制会议论文集(C)[C];2017年
3 林家骏;王赞基;;求解不可微优化问题的连续极大熵神经网络[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
4 李涛;刘朋;胡志宽;田宏业;;基于HHT时频图像和卷积神经网络的滚动轴承故障诊断[A];第十八届船舶水下噪声学术讨论会论文集[C];2021年
5 高宇航;张超;李兵;商德江;王一宇;;基于LM-BP神经网络的水下结构振动噪声预报[A];第十八届船舶水下噪声学术讨论会论文集[C];2021年
6 刘宝;张言新;;基于生物调节机制的神经网络预估解耦控制算法研究及应用[A];第32届中国过程控制会议(CPCC2021)论文集[C];2021年
7 逯峰;彭继国;张波;;循环神经网络在煤矿中的应用[A];煤矿自动化与信息化--第29届全国煤矿自动化与信息化学术会议暨第10届中国煤矿信息化与自动化高层论坛论文集[C];2020年
8 李强;张悦娇;;神经网络的自适应有限时间容错同步控制[A];“两化”教学模式在应用型大学人才培养中的探究和实践专题论文集[C];2021年
9 罗朝林;陈武奋;张波;梁啟斌;;基于小波优化神经网络在大坝变形预测的应用[A];水库大坝和水电站建设与运行管理新进展[C];2022年
10 张星;关悦;党鑫鑫;胡波;;基于遗传算法-长短期记忆神经网络的月降水量预测研究[A];2021年(第七届)全国大学生统计建模大赛获奖论文集(二)[C];2021年
11 张玺森;宋浏阳;郭旭东;王华庆;;基于域融合健康指标和时间卷积神经网络的轴承退化趋势预测方法[A];第十四届全国振动理论及应用学术会议(NVTA2021)摘要集[C];2021年
12 张俊豪;赵晋锋;刘力源;;基于卷积神经网络的探地雷达隧道衬砌检测[A];2021年工业建筑学术交流会论文集[C];2021年
13 徐兴;赵倩婷;王苏宁;余绍康;;基于神经网络的自适应飞机防滑刹车控制器[A];第十八届中国航空测控技术年会论文集[C];2021年
14 宋尚焕;朱伟;;基于卷积神经网络的水声目标杂波分类[A];2021年浙黑苏鲁沪渝四省二市声学技术学术会议论文集[C];2021年
15 刘华玲;何轶辉;;LSTM的季节性修正及在股票指数预测中的应用[A];第十六届(2021)中国管理学年会论文集[C];2021年
16 赵勇;任山山;Jürgen Kurths;;不同尺度耦合竞争忆阻BAM神经网络的同步[A];第十八届全国非线性振动暨第十五届全国非线性动力学和运动稳定性学术会议(NVND2021)摘要集[C];2021年
17 宋赫男;单小彪;王广炎;樊继壮;;基于NARX神经网络的悬臂结构识别与振动主动控制研究[A];第十八届全国非线性振动暨第十五届全国非线性动力学和运动稳定性学术会议(NVND2021)摘要集[C];2021年
18 赵猛;马新娜;祁琳;;基于卷积脉冲神经网络的滚动轴承故障诊断方法研究[A];第十八届全国非线性振动暨第十五届全国非线性动力学和运动稳定性学术会议(NVND2021)摘要集[C];2021年
19 张鑫;徐佳文;严如强;;基于压电阻抗的非线性结构故障诊断方法研究[A];第十八届全国非线性振动暨第十五届全国非线性动力学和运动稳定性学术会议(NVND2021)摘要集[C];2021年
20 谢正荣;艾轶博;张卫冬;;高阶间接积分法的深度循环神经网络架构[A];2021中国自动化大会论文集[C];2021年
中国博士学位论文全文数据库 前20条
1 柴丽;基于深度神经网络的语音增强目标函数设计研究[D];中国科学技术大学;2021年
2 吴兵;基于深度神经网络的水墨画艺术风格生成与识别研究[D];上海大学;2020年
3 林绍辉;深度神经网络压缩与加速关键技术的研究[D];厦门大学;2019年
4 丁清扬;基于神经网络和关键结合模式的网络药理学方法及应用[D];清华大学;2020年
5 冯谢星;面向深度神经网络的数据增强和优化方法研究[D];湖南大学;2020年
6 王佩琪;神经网络软硬件协同加速关键技术[D];清华大学;2019年
7 王奕森;随机森林和深度神经网络的若干关键技术研究[D];清华大学;2018年
8 赵俊红;神经网络的正则化及在地质预测中的应用研究[D];大连理工大学;2020年
9 纪厚业;异质图神经网络关键技术研究[D];北京邮电大学;2021年
10 姚卫;时滞忆阻神经网络的同步与多稳定性研究[D];湖南大学;2020年
11 肖理业;基于机器学习的电磁场建模与设计研究[D];电子科技大学;2019年
12 陈涵瀛;核电站热工水力系统工况预测与诊断方法研究[D];哈尔滨工程大学;2018年
13 梁智杰;聋哑人手语识别关键技术研究[D];华中师范大学;2019年
14 刘昂;微结构硅基光子学器件性能的研究[D];南京大学;2019年
15 赵博雅;基于卷积神经网络的硬件加速器设计及实现研究[D];哈尔滨工业大学;2018年
16 杜昌顺;面向细分领域的舆情情感分析关键技术研究[D];北京交通大学;2019年
17 陈科海;机器翻译上下文表示方法研究[D];哈尔滨工业大学;2019年
18 饶红霞;信息受限下神经网络的状态估计和拟同步研究[D];广东工业大学;2019年
19 张马路;Spiking机器学习算法研究[D];电子科技大学;2019年
20 付钱华;忆阻神经网络的动力学研究[D];电子科技大学;2019年
中国硕士学位论文全文数据库 前20条
1 李楠;基于深度神经网络的语音增强方法研究[D];东南大学;2019年
2 张馨;基于深度神经网络的语音增强算法研究[D];哈尔滨工业大学;2019年
3 时勇强;基于深度神经网络的语音增强算法研究[D];北京工业大学;2016年
4 魏泉水;基于深度神经网络的语音增强算法研究[D];南京大学;2016年
5 张宇飞;基于深度神经网络和循环神经网络的语音增强方法研究[D];中国工程物理研究院;2020年
6 洪伟疆;面向神经网络鲁棒性的数据增强方法[D];国防科技大学;2019年
7 张强;基于深度神经网络的多组分VOCs浓度反演方法研究[D];中国科学院大学(中国科学院西安光学精密机械研究所);2019年
8 郑莉;基于深度神经网络的语音增强算法研究[D];太原理工大学;2021年
9 林洁;深度神经网络中几类动力系统的研究[D];浙江师范大学;2021年
10 温照森;一种改进的区间神经网络抽象方法[D];华东师范大学;2022年
11 甘雨;深度神经网络方法在一些医学问题中的应用[D];四川大学;2021年
12 王卫梅;基于稀疏表示和深度神经网络的语音增强研究[D];太原理工大学;2020年
13 宋舫舟;深度神经网络的多粒度模型优化方法研究[D];北京邮电大学;2020年
14 张唯铭;循环神经网络在内蒙古地区沙尘暴预测中的应用研究[D];内蒙古工业大学;2020年
15 张超莉;深度神经网络运行时监控决策准确性的研究[D];北京工业大学;2020年
16 孙家新;基于深度神经网络的推荐技术研究[D];北京工业大学;2020年
17 张成尧;基于深度神经网络说话人识别方法研究[D];武汉理工大学;2020年
18 楚岩;基于深度神经网络的遥感图像变化检测[D];南京理工大学;2017年
19 马源;深度神经网络音素识别系统及其隐藏层研究[D];天津大学;2014年
20 娄迎曦;基于并行优化循环神经网络的语音增强方法研究[D];山东理工大学;2021年
中国重要报纸全文数据库 前20条
1 记者 张梦然;神经网络打开理解电子相互作用新窗口[N];科技日报;2021年
2 记者 董映璧;神经网络技术检测玻璃钢缺陷精度高[N];科技日报;2020年
3 湖北日报全媒记者 张爱虎 通讯员 徐向军 实习生 于蓝;一群“90后”率先建成铁路“神经网络”[N];湖北日报;2019年
4 记者 刘霞;忆阻器制成神经网络更高效[N];科技日报;2017年
5 整理 本报记者 诸玲珍 顾鸿儒;微软神经网络切割法可使加速作用超线性[N];中国电子报;2018年
6 ;神经网络小史[N];电子报;2018年
7 ;人工智能将取得大面积突破[N];中国企业报;2017年
8 本报记者 龚丹韵;人机大战:人类还有优势吗[N];解放日报;2017年
9 ;人类正迎来云端机器人时代[N];中国企业报;2017年
10 记者 邱智丽;AI竞赛 中国力量崛起[N];第一财经日报;2017年
11 记者 刘霞;新神经网络使计算机像人一样推理[N];科技日报;2017年
12 本报记者 喻思娈;人工智能有多智能?[N];人民日报;2017年
13 记者 王雪青;构建机器世界神经网络 东土科技“抄底”人工智能[N];上海证券报;2017年
14 ;人工智能到底有多智能?[N];长白山日报;2017年
15 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
16 记者 冯海波 通讯员 华轩;构建叠层宽度神经网络成深度模型[N];广东科技报;2021年
17 记者 毛黎;神经网络技术帮自主驾驶汽车识别幻影物体[N];科技日报;2020年
18 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
19 本报首席记者 任荃 实习生 史博臻;轨交“神经网络”触动创新神经[N];文汇报;2011年
20 记者 张梦然;神经网络完成芯片设计仅需几小时[N];科技日报;2021年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978