非平稳噪声环境下单通道语音增强技术的研究与实现
【摘要】:过去的几十年中,语音增强技术蓬勃发展。从传统的无监督方法的应用,到深度学习方法的兴起,语音增强相关方法虽已有颇多成果,但仍存在无限潜力。本文围绕目前应用最广泛的单通道语音增强技术展开研究。本文首先对传统无监督单通道语音增强方法,包括谱减法,维纳滤波法和卡尔曼滤波法进行了实验研究,评估了它们在平稳及非平稳噪声环境下的语音增强性能,分析了它们在非平稳噪声环境下性能差的原因。随后,提出了基于掩蔽预测网络的单通道语音增强方法。构建两个深度神经网络:掩蔽预测网络和辅助网络。将混合带噪语音和相应的纯净语音分别作为掩蔽预测网络和辅助网络的输入,运用添加了注意力功能的辅助网络来生成各相关时刻的语音参数信息,以引导掩蔽预测网络的训练。最后,提出了基于频谱映射网络的单通道语音增强方法。该方法利用语音信号的频域信息,通过级联添加掩蔽输出层的谱映射分离网络和特征提取网络,来实现语音频谱和噪声频谱的分离。该方法将注意力机制嵌入到深度神经网络中,在非平稳噪声环境下拥有更强的语音性能提升效果。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||
|
|
|||
|
|
|||||||||||||||||||||||||||||||||||||||||
|