语音信号数字化处理关键技术研究
【摘要】:近年来,数字语音信号处理技术得到了深入的研究和广泛的应用,目前研究方向主要集中在语音端点检测、语音降噪、语音识别和语音合成等领域,其中作为语音信号处理系统前端的语音端点检测技术至关重要。但是由于背景噪声复杂、检测算法不够完善等因素的影响,目前语音端点检测的准确率还不够理想,还不能很好保证语音信号处理系统的稳定性。因此,提高语音端点检测的准确率对提高语音信号处理系统的稳定性具有重要意义。本文首先对传统语音端点检测算法进行了综述,在此基础上提出了一种改进方法,提高了低信噪比环境下的语音端点检测的准确率,进而基于谱减法对低信噪比环境下的语音降噪进行了研究,最后结合语音端点检测与语音降噪,设计了一种孤立词语音识别系统。本文主要工作如下:(1)提出了一种基于梅尔能量比的低信噪比环境下的语音端点检测算法。在低信噪比环境下,传统语音端点检测算法无法保证较高的准确率。针对这一问题,本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCC_a),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测。实验结果表明,本算法在不同类型的低信噪比噪音环境下的端点检测准确率较其他传统算法整体提高了约30%。此外,本文还将神经网络应用到语音端点检测当中,设计了神经网络和语音特征参数混合的语音端点检测模型,来比较采用不同语音特征参数时的端点检测准确率。实验结果表明,使用梅尔能量比作为语音特征参数进行语音端点检测的准确率较其他特征参数的准确率整体提高了约10%,进一步验证了选取梅尔能量比作为端点检测的特征参数的优越性。(2)基于谱减法提出了一种低信噪比环境下的语音降噪算法。目前较为成功的语音降噪算法有谱减法、维纳滤波法以及LMS自适应滤波法等。其中谱减法是最常用的算法,但是也存在着无话段误判、噪音估计不准确等问题。本文提出了一种基于谱减法的语音降噪算法,该算法基于高准确率的语音端点检测来对噪音进行准确估计,自适应的更新背景噪声谱,提升降噪效果。实验结果表明,经过本方法降噪后的语音信号的信噪比在整体上较传统谱减法提高了1d B。(3)设计了一种基于DTW的语音识别系统。基于高效的语音端点检测算法和语音降噪算法,本文对传统的动态时间规整(DTW)语音识别算法提出改进,设计出一种新的语音识别系统。该系统不仅提高了语音识别的准确率,而且提高了系统在低信噪比环境下的稳定性。