基于GSC结构的麦克风阵列语音增强技术研究
【摘要】:日常生活中麦克风所接收到的语音信号会被各种噪声所污染,这种现象是在所难免的。因此混合语音信号在处理之前通常先会对语音质量进行改善,而语音增强技术便可以用来对混合语音信号进行预处理,从而得到较为纯净的语音信号。与传统的单通道麦克风语音增强算法相比,麦克风阵列语音增强技术可以更好地处理复杂噪声环境中的方向干扰噪声,提高语音的清晰度。本文主要内容如下:1、阐述了包括GSC算法在内的几种经典麦克风阵列波束形成算法,并设置了简单与复杂两种声学环境,分别对GSC波束形成语音增强算法和固定波束形成语音增强算法在两种情况下进行实验分析及对比。由此得出GSC算法具有非相干噪声抑制能力差、信号自抵消的固有缺陷。2、针对GSC算法非相干噪声抑制能力差的缺陷,提出了一种基于谱减(Spectral subtraction,SS)法改进的GSC-SS语音增强算法,将改进后的谱减法作为后置与GSC算法进行级联,对归一化改进GSC算法的输出信号作功率谱减处理,实验结果表明,该算法可以有效改善GSC算法非相干噪声抑制能力弱的缺陷,但却容易产生“音乐噪声”。3、针对GSC-SS算法存在“音乐噪声”的不足,提出了一种基于Kalman滤波改进的GSC算法,将Kalman滤波算法作为后置,利用前刻状态与当前状态观测值估计当前值,将滤除方向性干扰噪声后的语音信号输出到级联的Kalman算法中,GSC输出信号所残余的背景噪声通过迭代最小均方误差进行噪声估计,从而抑制非相干噪声与麦克风阵元所产生的热噪声。实验结果表明,该算法在噪声抑制上与传统的GSC算法及后置谱减滤波算法相比具有明显的优越性,增强后的信号可保留更多有用信息。4、针对复杂噪声环境下GSC自抵消现象,提出了一种基于DNN改进的GSC算法。该算法通过多目标DNN代替GSC结构中的下层分支,依赖于DNN强大的数据拟合能力来改善自抵消现象。实验结果表明,相对于传统GSC算法,此算法具有很好的复杂噪声环境适应能力,相比传统GSC算法和本文所提另外两个算法,该算法增强后的语音更接近于目标语音信号。